青年报·青春上海记者 范彦萍/文、图、视频 郭容/剪辑
现如今,AI已经覆盖到生活和工作的方方面面,但人工智能越来越需要海量数据进行训练。有些真实数据的获取十分困难,这时生成式AI与仿真技术结合的新技术就派上了用场。在业内,这一技术已经开始应用于自动驾驶和具身智能领域。
此次50人论坛创新创业青年代表、启数光轮科技(上海)有限公司创始人兼首席执行官谢晨博士是国际顶尖的仿真专家,曾在Nvidia(英伟达)、Cruise、蔚来等企业担任自动驾驶仿真负责人,国际首创将生成式AI融入仿真。
1987年出生的谢晨是一位创业新星,去年年初从蔚来辞职,创办属于自己的科技公司,他的初心是,希望让合成数据赋能更多行业,让它们能走上迅猛发展的快车道。
从物理到金融到科技
他在物理和AI世界中游走
可能很多人对合成数据行业比较陌生。以自动驾驶为例,过去遇到一个很难获得的长尾场景(Corner Case),需要公司到马路上采集数据,前后耗费几个月的时间。但通过生成式AI结合仿真,几天就能生成大量的3D、物理真实、可泛化的合成数据。
翻开谢晨的履历,堪称妥妥的学霸。他毕业于北京大学物理系,之后又获得全额奖学金攻读美国哥伦比亚大学数量金融博士学位。
读博期间他养了一只名叫土豆的狗,并创办了一个宠物线上社区APP,拥有了一批忠实的用户,但因为无法实现商业化而关闭。这段经历在他心里种下了一颗创业的种子,但同时也让他清晰地认识到,创业项目必须认真思考商业化。
从物理到金融再到AI创业,博士毕业后谢晨的从业经历也非常丰富。早先对科技感兴趣的他去了一家美国商业地产公司VTS,为该公司做移动化优先和ML算法升级。2年时间,VTS发展成了独角兽,人员从20人发展到500人,并且兼并了竞争对手。离开VTS后,他去了线上电商公司Jet.com和沃尔玛(Jet.com收购方)负责整体的线上动态定价算法。
希望追求更大技术挑战的他后来去了通用汽车自动驾驶子公司Cruise,负责自动驾驶仿真。在Cruise时,他便已经是整个自动驾驶行业最早将生成式AI与仿真相结合的专家,Cruise所用50%的数据都是合成数据。离开Cruise 后他又去了Nvidia(英伟达)担任自动驾驶仿真负责人,做了更大量的将生成式AI与仿真相结合的工作。
在硅谷时,他密切关注国内自动驾驶发展,于2021年回国加入蔚来,负责从0到1搭建蔚来的自动驾驶仿真部门。
虽然接触的行业不同,但谢晨认为,自己一路走来都是在和仿真、和世界模拟打交道,从最早在本科做核物理仿真,到博士做量化对金融系统进行仿真模拟,到做电商定价对用户行为、价格系统进行仿真模拟,到做自动驾驶/具身智能数据的仿真模拟。看似不同的事情其实本质是类似的。
在蔚来工作的后期,他发现团队已经可以在没有他参与的情况下良好运转。这时,谢晨觉得是到了圆自己梦的时候了。
在自动驾驶、具身智能的工作中,他对生成式AI与仿真结合的信念越来越强。“我们做合成数据,为AI算法训练提供稀缺的、高价值密度的、规模化的数据,从而提升算法的性能和准确性。我们的目标是成为数据领域的英伟达。我认为卖数据是个很好的商业模式,一方面为数据付费被整个行业接受,同时合成数据可以做到标准化和规模化。”
相较人工采集和标注
将数据生产效率提升100倍
谢晨介绍说,在Scaling Law(标度律)下,生成式AI时代相比之前需要更大量的数据。真实世界数据是有限的,需求一定要被合成数据满足。合成数据本质上就是程序化生成数据,包括NLP数据、视频数据等。“我认为应该切入供给紧缺、需求增长、壁垒较厚的需求点。就像黄仁勋所说,AI要进入物理世界,就需要3D、物理真实、有交互的数据,这类数据是很欠缺的,可以服务自动驾驶和具身智能。Sora也给我一个很大的启发:在虚拟世界展示对物理世界的理解,也需要有3D、物理真实的合成数据。”
创办公司后,谢晨对合成数据的信念越来越强。一方面是源于自己之前在英伟达、Cruise、蔚来都从“0-1”做过类似的事情,他已经看到企业对于数据的巨大需求,以及合成数据对于模型带来的巨大价值;另一方面AI大模型能力的提升,使得合成数据的生产效率和质量相较于之前也有了更大的提升。“合成数据是对AI发展巨大的加速,我希望提供国际最领先的合成数据解决方案来加速AI发展。”
创业的这一年多来,AI行业发生了翻天覆地的变化,国内公司对合成数据的应用也开始形成共识。
在谢晨看来,从事合成数据研发最缺的是优秀人才,因为该技术涉及多学科,需要既懂AI又懂仿真,且同时有很强工程能力的交叉人才。“我们团队有很多优秀人才,而我自己应该是国内唯一一个有国际上多次从0-1构建合成数据产品的人,同时我们团队有英伟达的仿真技术负责人、量产自动驾驶感知技术负责人、达摩院仿真负责人、蚂蚁最年轻的算法P8等。”
其次,谢晨率领团队成员建立了规模化的数据闭环,让他引以为傲的是,他所创办的企业拥有国际上最大规模的高质量自动驾驶和机器人的训练级资产库。
听起来合成数据就是将AI与仿真技术相结合,但如何高效有机地结合,在谢晨看来,这件事之前很少有人做过,需要跨学科的认知和技能。“在国际上我在一些头部公司工作时是最早做的,现在在国内市场我们是第一家这么做的。”
对于光轮的优势,谢晨解释说,一方面他们给客户提供高价值、难以获取的数据(如主机厂出海、Corner Case等应用场景);另一方面,针对真实数据利用率低的问题,他们能放大真实数据价值(如跨车型/平台迁移、数据泛化等应用场景)。在数据合成模式下,数据生产效率相较于之前的人工采集和标注可以提升100倍。
创业不是比吃苦
要追求技术的独特性
外界形容创业者是“创业狗”,谢晨并不认可这一说法,“创业不是比吃苦,而是要追求技术的独特性。”
关于创业,谢晨形容说创业的经历很特别,每天都有很强的兴奋感,能够解决一些具体的问题,感觉很棒。“发现我是为创业而生的。之前的工作会遇到环境不支持我做一些事情,会有无力感。创业之后,我对所有事情有掌控权,无论成功或是失败。我找到了自我应该在的状态。”
如果说绝大部分创业公司都为找客户犯愁的话。这个问题对光轮来说似乎不存在。谢晨认为,技术创业者的能力分三层,技术层、产品层、商业层。商业很关键,但往往被技术创业者忽视,大部分的技术创业者局限在技术层以及产品层。“我比较幸运,是因为我之前经历跨度比较大,既在技术层深扎过,也负责过产品与商业。很多商业底层是对人的把握,只有从内心希望去帮助客户解决问题,真正能够理解客户可能想说又没说的东西,做出合理的判断和执行,才能赢单。”
“我们公司的销售更像是痛点挖掘者。”谢晨透露说,销售最关键的点还是以客户为中心,公司成员早期会和大量的客户进行交流。以自动驾驶行业客户为例,他们会和企业中的算法团队、仿真团队、数据团队等进行大量交流,获得全面的客户需求信息。在这些信息的基础上,会看客户的痛点和痒点分别是什么,客户评估产品的维度是什么,客户如何测算ROI、会愿意为什么进行付费。同时商业化上的思考也很重要。最后,还要确定不做什么事情,要深挖一个点而不是打一个面。
“一定要抓住客户真正的痛点,而不是痒点。”谢晨表示,合成数据是一个很新的技术,很多客户希望去尝试。首先要专注在雪中送炭的刚需上。精准判断什么是雪中送炭,什么是锦上添花,这就需要自己对客户的算法、技术阶段、具体面临的问题有清晰的认知,以及与客户紧密地交流。
目前光轮智能已经与国内外多家头部主机厂和自动驾驶公司签约合成数据产品订单。谈及未来的规划,谢晨表示,从今年开始,由于自动驾驶量产进入下半场,各家都在比拼更快速地在不同城市落地NOA。市场越来越卷,合成数据的需求也越来越大。“我们目前底层技术相对成熟,已经迈过了0到1,近一两年更多会聚焦在产品化、规模化,以及进一步拓展具身智能、多模态市场。我认为,随着AI的高速发展,5年以内合成数据的需求量会占到所有数据体量的90%~95%,因此我们任重道远。”
青年报·青春上海记者 范彦萍/文、图、视频 郭容/剪辑
编辑:陆天逸
来源:青春上海News—24小时青年报
相关知识
50人论坛创新创业青年代表谢晨:他是国内顶尖的AI与仿真技术专家,希望让更多行业走上快车道
2023 AI影像艺术与科技前沿论坛圆满举办
国内宠物医疗顶尖论坛,宠物行业的未来在哪?
宠物营养创新论坛在京举办 院士专家共话宠物健康
2023宠物健康创新发展论坛在沪成功举办 宠物双效创投联盟正式成立
未名创星论坛第十四期——宠物行业未来的发展与机会
宠物营养与健康科技创新论坛举办 院士专家共话宠物健康
关于举办2021年浙台青年数字经济创新创业大赛的通知
信元集团完成首轮融资,未来发展进入快车道
《当代动画》|人工智能时代的艺术生产 ——“2023AI影像艺术与科技前沿论坛”综述
网址: 50人论坛创新创业青年代表谢晨:他是国内顶尖的AI与仿真技术专家,希望让更多行业走上快车道 https://m.mcbbbk.com/newsview337634.html
上一篇: 广州部分商场设宠物厕所 有社区开 |
下一篇: “正确养犬,守护宠物狗的福祉与社 |