【2023年12月13日AI晚报】微软发布27亿参数基座模型Phi-2；美图推出移动端 AI 生图工具 WHEE

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]

[t-success icon='']AI·快讯[/t-success]

1、微软发布27亿参数基座模型Phi-2

昨日晚间，微软发布27亿参数的语言模型Phi-2，据称可与规模大25倍的大模型相媲美，该模型目前已加入Azure AI Studio。Phi-2基于Transformer训练，目标是预测下一个单词，它在1.4T个词组上进行了训练，这些词组来自NLP和编码的合成数据集或网络数据集，训练在96个英伟达A100 GPU上耗时14天。Phi-2是一个基座（Base）模型，没有通过人类反馈强化学习（RLHF）进行调整，也没有经过指导性微调。在多个基准测评上，只有2.7B的Phi-2性能超越了Mistral和Llama 2的7B或13B模型，以及谷歌3.2B规模的Gemini Nano 2。（来源：IT之家）

官方介绍：https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models

2、Meta 开启雷朋智能眼镜多模态 AI 功能测试，可识别物体、翻译语言

Meta 公司今日宣布，将开始向部分用户推送其 Meta Ray-Ban 智能眼镜的多模态 AI 功能。这项功能可以让 AI 助手通过眼镜的摄像头和麦克风，了解佩戴者所看到和听到的东西，并提供相关信息和帮助。Meta CEO 马克・扎克伯格在 Instagram 上展示了这项功能，他让眼镜推荐能与他拿着的一件衬衫相配的裤子。眼镜不仅准确描述了衬衫，还提供了几款搭配建议。除此之外，扎克伯格还展示了眼镜 AI 助手翻译文本和生成图片描述的能力。

3、便携式AI系统可将思想翻译成语言

据物理学家组织网11日报道，澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统，可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤（包括中风或瘫痪）而无法说话的人进行沟通，也有望实现人与仿生手臂或机器人等设备之间的无缝通信。最新研究代表了将原始脑电图（EEG）直接翻译成语言的开创性努力，标志着该领域的一次重大突破。（来源：科技日报）

4、OpenAI非盈利母公司财务数据发布

据外媒The Verge报道，美国国税局（IRS）近日发布了OpenAI的非盈利母公司2022年的财务数据，但其中不包括OpenAI实体公司的数据。文件显示，CEO萨姆·阿尔特曼（Sam ALtman）在2022年获得了7.35万美元的报酬，联合创始人格雷格·布罗克曼（Greg Brockman）和伊利亚·苏特斯科夫（Ilya Sutskever）的薪酬分别为11.4万美元和33.5万美元，前董事会的其他三名成员分文未得。

文件地址：s3.documentcloud.org/documents/24215980/openai-form-990-irs-2022.pdf

5、北京互联网法院公开审理全国首例“AI 声音侵权案”

据北京互联网法院官方公众号消息，12 月 12 日，北京互联网法院首次组成五人合议庭，依法公开审理全国首例“AI 声音侵权案”，目前该案仍在进一步审理中。在该案中，原告殷某某以配音为职业，曾录制多部有声作品。殷某某意外发现，自己的声音被 AI 化后，在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。因此，殷某某以被告行为侵害其声音权为由，将“魔音工坊”的运营主体北京小问智能科技有限公司等五被告起诉到北京互联网法院。（来源：IT之家）

6、华为交通大模型研发启动

据华为云官方消息，12 月 12 日，华为技术有限公司联合云南省交通投资建设集团有限公司以及长安大学在昆明举行“交通大模型研发启动仪式”，正式开启人工智能大模型技术在交通领域的研究探索。据介绍，为加速推动交通行业智能化发展水平，抢占行业发展先机，加速交通企业数字化转型，基于华为云盘古大模型，华为携手云南交投集团、长安大学，通过技术赋能、人才发展、高校协同、生态聚合等多重举措，积极开展交通大模型研究和探索工作。（来源：IT之家）

7、安卓 Canary 版微软 Edge Copilot 已支持视频摘要功能

微软 Edge 浏览器近日在 Android Canary 版本中更新了 Copilot 功能，使其可以为带有字幕的 Youtube 视频生成摘要。该功能此前已在桌面版 Edge Canary 频道上线，现在登陆了安卓平台。如何使用 Copilot 在 Edge Canary 浏览器上生成视频摘要：

确保你使用的是最新版 Edge Canary 浏览器（版本号为 121.0.2271.0）。
访问 edge://flags，找到并启用“Video Copilot”选项。
重启 Edge 浏览器。
打开带有字幕的 YouTube 视频。
点击底部 Copilot 图标，并点击总结视频内容按键。
Copilot 将生成简短的视频摘要，并列出视频中重要时刻的时间戳，供快速跳转。

8、美图推出移动端 AI 生图工具 WHEE，基于 MiracleVision 大模型

据美图秀秀消息，移动端 AI 生图工具 WHEE 现已上线，基于美图 MiracleVision 大模型，提供一站式 AI 视觉创作服务。官方表示，WHEE 是一款在线生成的 AI 视觉创作工具，面向大众用户及专业视觉创作者，以“工作流”作为核心功能串联，提供文生图、图生图、画面拓展及局部修改等 AIGC 图像服务。美图公司日前刚刚推出了 AI 模型 MiracleVision 4.0 版本，相比上一代新增了“AI 设计”与“AI 视频”能力，新版本将于 2024 年 1 月陆续应用于美图秀秀、美颜相机、Wink、美图设计室、WHEE 等美图旗下产品。

AI·新世界