AI创新｜四足机器人又出新品种、文案/代码编辑器Canvas、国内首个万卡万参大模型……

首页行业资讯当前

发布时间:2024-10-11

看点概览：

一、OpenAI发布Canvas，像文案、代码编辑器一样

二、全国产化替代，国内首个万卡万参大模型

三、Video Ocean文生视频的光影魔术和焦点艺术

四、四足机器人又出新品种了

五、迈向多语言医疗大模型

一、OpenAI发布Canvas，像文案、代码编辑器一样

（图源：微信公众号@量子位）

OpenAI发布Canvas，一个与ChatGPT合作写作和编程的新界面。这个全新的界面，是由OpenAI的GPT-4o来构建，需要在模型选择栏中单独pick出来使用——“GPT-4o with canvas”。在Canvas模式之下，就不仅仅是简单对话的过程了，而是允许用户可以对生成的内容进行二次创作和编排，就像文案、代码编辑器一样。

在ChatGPT给出生成内容之后，在界面的右下角有一个“编辑”的按钮，这个按钮展开之后有五个功能：

● 编辑建议（Suggest edits）

● 调整上下文长度（Adjust the length）

● 更改阅读水平（Reading level）

● 添加最终润色（Add final polish）

● 添加表情包（Add emojis）

Canvas编程包含以下五种功能：

● 审查代码（Review code）

● 添加日志（Add logs）

● 添加注释（Add comments）

● 修复bug（Fix bugs）

● 转换语言（Port to a language）

内容详情：OpenAI重磅发布Canvas：跟ChatGPT一起写作编程

二、全国产化替代，国内首个万卡万参大模型

（图源：微信公众号@中国电信人工智能研究院）

中国电信人工智能研究院（TeleAI）成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型（万卡万参），并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。

这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院（TeleAI）院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果，标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。

TeleAI 连获中国计算语言学大会（CCL2024）挑战赛两项冠军，以及NLPCC2024 中文议论文挖掘（Shared Task5）挑战赛冠军。

内容详情：重磅！TeleAI 完成首个全国产化万卡万参大模型训练，并正式开源 TeleChat2-115B

三、Video Ocean文生视频的光影魔术和焦点艺术

精准捕捉面部细节，真实感渲染技术，赋予数字面孔新生命

潞晨2.png

深入微观世界，探索细节之美，将精细成像的艺术发挥到极致。

（图源：微信公众号@潞晨科技）

潞晨Video Ocean文生视频应用正式上线，在本次产品迭代中，对人脸渲染进行了深度优化，同时扩展了镜头语言的多样性，提升了画面的纹理和质感，风格上也更加多元化，为用户打造了一个更加立体和多彩的视觉体验，使得视频创作变得简单便捷。

内容详情：潞晨Video Ocean正式全面公测，视频大模型全方位升级重塑视觉体验

四、四足机器人又出新品种了

（图源：https://helpful-doggybot.github.io/）

斯坦福大学的研究团队最近发布了一款名为Helpful DoggyBot的四足机器人，通过整合先进的计算机视觉技术和自然语言处理，机器人能够理解人类的指令，并在复杂的环境中寻找和抓取物体。借助视觉－语言模型（VLMs）和低级全身控制策略的协调指令，DoggyBot机器人能够执行以下任务：

● 爬上床去取一个网球；

● 低下身子捡起一个水瓶；

● 爬上沙发拿起一个毛绒玩具；

● 在取回网球后，从床上下来。

内容详情：开源小狗机器人：助你获取开放世界中任何物品！

五、迈向多语言医疗大模型

在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型，并受制于缺乏多语言医疗专业数据的限制，导致当前的医疗大模型在处理非英语问题时效果不佳。

为了克服这一挑战，近期一篇发表在《nature communications》的论文全面地从数据、测评、模型多个角度考虑了多语言医学大语言模型的构建，做出了三项贡献：

1. 创建了一个包含 25.5 Billion tokens 的多语言医疗语料库 MMedC。

2. 开发了一个全新的多语言医疗问答评测标准 MMedBench, 覆盖了 6 种语言，21 种医学子课题。

3. 推出了一款名为 MMed-Llama 3 的全新基座模型，以 8B 的尺寸在多项基准测试中超越了现有的开源模型，更加适合通过医学指令微调，适配到各种医学场景。

所有数据和代码、模型均已开源。

论文标题：Towards building multilingual language model for medicine

论文地址：https://www.nature.com/articles/s41467-024-52417-z项目地址：https://github.com/MAGIC-AI4Med/MMedLM

Leaderboard: https://henrychur.github.io/MultilingualMedQA/

内容详情：迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

AI 创新｜分享人工智能领域的技术革新和创新应用的新动态，与读者共同关注AI领域的创新思维与实践。

AI美图

【上一篇】定了！极氪向这家公司发出 “红外热成像” 项目定点函

【下一篇】突破！晶合集成28纳米逻辑工艺通过验证