首页 行业资讯 当前
AI创新|机器人先行者K2开始抢蓝领工作了、Hallo2可生成一小时高清4K视频、音频定制概览和后台播放……
发布时间:2024-10-24

看点概览:

一、机器人先行者K2开始抢蓝领工作了

二、开源Hallo2,可生成一小时高清4K视频

三、NotebookLM 音频功能升级,定制概览、后台播放

四、凌云出海,华为云开天跨境平台正式亮相

五、PaddleNLP上新!与源2.0开源大模型完成全面适配

 

一、机器人先行者K2开始抢蓝领工作了


10月24日.gif

 

近日,上海开普勒机器人有限公司自主研发的全尺寸通用人形机器人先行者 K2 正式全球发布。

 

先行者K2的具身智能软件在动态智能感知、智能任务规划、全身协同操作、自主训练学习、自主智能移动等方面取得了全面进展。通过基于云端大模型的大脑+具身小脑的组合,模仿学习+强化学习的技能训练,K2基本实现了自主完成特定场景工作任务的能力,具身智能训练效率也得到大幅提升。根据场景需求,先行者K2的硬件体系围绕手臂和腿部肢体结构、触觉灵巧手、布线方式、电源系统、本体自由度和工业造型等进行了全面升级。

 

内容详情:开普勒正式发布人形机器人先行者K2,开启商业化进程


二、开源Hallo2,可生成一小时高清4K视频


hello 2.png

(图源:微信公众号@机器之心SOTA模型)


Hallo2是一个音频驱动的人像图像动画项目,项目由复旦大学、百度和南京大学的研究人员合作开发,提供了开源代码和预训练模型,方便用户进行二次开发和应用。能够生成高分辨率和长时段的人像动画,除了实现4K的图像输出,Hallo2还允许用户通过文字来控制肖像的表情。这意味着,如果你想让一个角色笑或者皱眉,只需要在输入中描述一下,模型就能生成相应的动画。

 

内容详情:复旦&百度又一力作!可生成一小时高清4K视频,音频驱动视频生成开源项目Hallo2


三、NotebookLM 音频功能升级,定制概览、后台播放

谷歌.png

(图源:微信公众号@AGI Hunt)


NotebookLM产品负责人Raiza Martin在Twitter上宣布了一系列重大更新,让这款AI笔记工具变得更加强大和灵活。

 

音频概览功能升级,用户可以点击自定义选项,为音频概览提供额外的指令。比如,你可以要求它专注于特定主题、基于特定来源,甚至调整概览的目标受众,这样你可以得到更加个性化和精准的音频摘要,还支持后台播放。

 

内容详情:NotebookLM最新大升级:定制音频概览、后台播放,并推出企业版


四、华为云开天跨境平台正式亮相

华为.jpg

(图源:微信公众号@深圳商务)


华为云开天跨境平台是一款面向企业、生态服务商和政府的综合性数字化贸易平台。

 

据华为云新零售领域总经理赵国兴介绍,华为云开天跨境平台以AI技术为核心,基于1个数字化平台底座、N个覆盖上中下游产业的专业服务及工具,以及X个涵盖Sparkpack、 SaaSPackage、BI等在内的应用,通过整合全球资源和服务,提供包括转型咨询、供需对接和行业数字化解决方案在内的全方位服务。该平台致力于赋能跨境产业链转型升级,助力中国企业提升国际竞争力。

 

内容详情:凌云出海,智启新航,华为云开天跨境平台正式发布


五、PaddleNLP上新!与源2.0开源大模型完成全面适配

百度.png

(图源:https://github.com/PaddlePaddle/PaddleNLP/tree/develop/llm/config/yuan/README.md)


近日消息,源2.0开源大模型与百度 PaddleNLP 完成全面适配,PaddleNLP是百度基于飞桨框架打造的大语言模型套件,源2.0系列基础大模型是首个全面开源的千亿参数模型。此次适配标志源2.0大模型迁移到飞桨生态中,丰富了 PaddleNLP 的大模型库,方便用户在 PaddleNLP 内快速使用源2.0大模型的能力,并能使用特定领域的数据集做微调,利用相对较少的资源就能训练出更适合实际应用场景的大模型。

 

内容详情:PaddleNLP上新!浪潮信息源2.0全面接入,大模型生态加速进化!


AI 创新|分享人工智能领域的技术革新和创新应用的新动态,与读者共同关注AI领域的创新思维与实践。


AI美图

AI图.png

(图源:即梦AI生成)

今天解决不了的事情,别着急,因为我明天也解决不了。凡是能用钱解决的问题,我一件也解决不了。



【上一篇】这个区给2万个垃圾桶装上RFID,判断居民是否有垃圾分类
【下一篇】净利暴涨2079%!通信市场正在回暖?
相关文章
粤ICP备05006090号-11 版权所有@IOTE 物联网展始于2009 | 深圳市物联传媒有限公司