点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI见闻日报:机器人看YouTube学会做家务,大规模视频训练机器人要火了!- 见智研究
首页>国际频道>国际要闻>正文

AI见闻日报:机器人看YouTube学会做家务,大规模视频训练机器人要火了!- 见智研究

来源:人民日报2024-04-17 04:12:39

AI见闻日报:机器人看YouTube学会做家务,大规模视频训练机器人要火了!| 见智研究

今日要点

1、机器人看YouTube学会做家务,大规模视频训练机器人成为重要路径;

2、AI果不其然对视频下手了,十秒剪视频,Whisper模型让每个人都能成为“剪辑师”;

3、开源大模型明星更新第二版:ChatGLM2-6B推理更快文字更长,允许商用授权;

4、PrivateGPT 开源模型可实现不连网提问;本地部署未来空间大;

5、李彦宏表示:百度文心大模型推理速度提升17倍;

每日见智AI

1、机器人看YouTube学会做家务,大规模视频训练机器人成为重要路径

CMU机器人研究所助理教授Deepak Pathak展示了一种视觉机器人桥方法(VRB);通过让机器观看人类行为方式的视频完成行为模拟,并验证了该方法的有效性。

视频中机器人下观看了几个人类开抽屉的视频后,”CMU指出,“机器人可以确定如何打开任何抽屉。

CMU依赖于来自Epic Kitchens和Ego4D等数据库的视频,后者拥有“来自世界各地的近4小时的以自我为中心的日常活动视频”。

见智点评:

这种方法的关键在于利用大规模的视频数据来训练机器人,并从中学习人类行为和操作。这为机器人的应用提供了更广泛的可能性,可以通过观察互联网和YouTube等视频来获取更多的训练数据。这种方法可以改进机器人的操作能力,并为机器人在日常生活中的应用提供更多的机会

2、AI果不其然对视频下手了,十秒剪视频,Whisper模型让每个人都能成为“剪辑师”

荷兰开发者Matthijs Hollemans在HuggingFace上基于Whisper开发了视频剪辑新功能,现在剪视频能够精准到每个字。

在平台上可以对上传的视频内容进行同步文字转化,只需要选择留下的文字,然后就可以直接生成所需的片段。使用过程非常简单,可累比相机界的“傻瓜相机”。

见智点评:

AI应用层出不穷,此前主要是AI生成图片内卷非常严重,几乎是每周都有重要更新,现在这个迭代速度已经开始向视频领域蔓延,这个小白剪视频的功能让剪视频门槛大大降低,同时节省了很多制作时间,效率优化超过90%,对于视频创作行业来说具有重大影响。

3、开源大模型明星更新第二版:推理更快文字更长,允许商用授权

清华大学KEG和数据挖掘小组(THUDM)发布了第二代ChatGLM2-6B;

相比第一代ChatGLM2-6B来看,二代在几项测评中都有了不同程度的提高:

a、特别是数学推理能力提升幅度571%;

b、支持更多轮次的对话,并且文字长度限制也从2K提升至8K;

c、更快的推理能力,相比第一代速度提高42%;

d、向学术研究全面开放,并且允许申请商用授权;

见智点评:

ChatGLM2-6B是国内最强的开源大模型,本次更新具有重大意义,特别是在数学推理能力、对话长度和轮次、推理速度等方面的优化,将对数学教育、学术研究、商业应用等领域产生积极影响。

4、PrivateGPT 开源模型可实现不连网提问;本地部署未来空间大

开发者Iván Martínez Toro发布了PrivateGPT开源模型,该模型允许用户在无需互联网连接的情况下,通过提供自己的文档来向模型提问。

PrivateGPT可以在家用设备上进行本地运行,使用前需要下载名为"gpt4all"的开源大语言模型(LLM)。用户需要将所有相关文件放入一个目录中,以供模型引入所有数据。完成LLM的训练后,用户可以向模型提出任何问题,它将使用提供的文档作为上下文来回答。PrivateGPT能够处理超过58000个单词,目前需要大量本地计算资源(推荐使用高端CPU)进行设置。

Toro表示,当前PrivateGPT处于概念验证(PoC)阶段,它至少证明了可以在本地创建类似于ChatGPT的大模型。可以预见,一旦这种PoC转变为实际产品,PrivateGPT将具备让公司获得个性化、安全和私密的ChatGPT来提高生产力的潜力。

见智点评:

PrivateGPT开启行业对本地化部署的重视程度,这对于那些关注数据隐私和安全的行业和个人非常重要。通过本地化部署,用户可以更好地控制和保护他们的数据,减少了数据泄露和侵犯隐私的风险;开源模型和本地化部署将在未来产生积极的影响。

5、李彦宏:百度文心大模型推理速度提升17倍

在世界互联网大会数字文明尼山对话上表示:新的国际竞争战略的关键不在于一个国家拥有多少个大模型,而是看这些大模型能够应用于多少原生AI应用,并在多大程度上提升了生产效率。

他还透露,百度文心大模型已经更新到3.5版本。相比于3.0版本,新版本的训练速度提升了2倍,推理速度提升了17倍,并且模型的效果总体上提升了超过50%。在数据质量、生成效果和内容安全性方面都有明显的提升。返回搜狐,查看更多

责任编辑:

[责编:admin]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行/
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 诺基亚研发竟投千亿欧元!5G专利居行业领先地位

  • 浙深备战G3!吴前苦练三分,布克强化持球,郑永刚提心态+战术

独家策划

推荐阅读
D模型设计让游戏的画面变得十分传神和立体,让玩家似乎置身其间,沉溺其间。
04-16 23:39
海量三国名将任你选择搭配,为你而战;
04-16 19:07
【大象直聊】:在线聊工作,入职招人更高效。
04-16 05:29
可以查询健康码或者其他的进度
04-16 00:56
分享美好的事物。可以分享一些自己买的好货,给别人一些参考。
04-15 20:23
拉杰伊尔大挑战全新0人团队副本
04-15 11:18
您也可以在app中对图纸进行简单的标注;
04-15 02:13
每当你点击不同的按键时,将会改变后面的更种关卡的变化,角色的等级结局也有不同。
04-14 21:40
个游戏角色,供你任意选择?
04-14 17:07
实时定位功能,根据您所在的位置,实时定位,可以随时查找周边附近的药店;
04-14 12:35
沉睡的救赎曙光的彰显武神阵容全面觉醒;
04-14 08:02
您可以更好地在线处理最高质量的照片,并获得各种处理服务的相关信息。
04-14 03:29
有猫独角兽等可爱多样的D像素角色
04-13 22:57
紧张刺激的战场,激素飙升的竞技,组队挑战团队协作,语音交流轻松杀敌。
04-13 18:24
合理的卡片和道具选择恰到好处的陷阱投放,可以为你取得巨大的优势。
04-13 13:51
参与到华丽的战斗形式之中来,用你们的实力来征服更多的地图。
04-13 09:19
加载更多