张亚勤院士在清华无锡研究院智能产业创新中心接受了采访,他认为当前的具身智能和AI投资创业热潮需要“降温”,保持更加冷静的态度。
他创立的清华大学智能产业研究院(AIR)已孵化出十家公司,这些公司累计融资约150亿元,估值高达1500亿元。尽管如此,张亚勤强调AIR的首要任务是科研,公司孵化只是副产品,大多数公司仍处于验证能力的阶段。
作为中国工程院院士,张亚勤曾经历技术革命和资本周期的起伏。他认为当前AI发展阶段类似于1998-1999年的互联网,正处于大规模投资基础设施(电力、算力、算法)的时期。他看好AI产业的长期潜力,认为“AI没有泡沫,但早期AI公司会有泡沫”,并预测未来万亿市值的巨头可能并非当下备受瞩目的公司。
张亚勤指出,“物理AI”在2026年成为热门方向,而他与团队在自动驾驶、具身智能仿真、工业能效AI等领域已有所布局。他反对“趁市场热多融资”的冲动,认为过度融资可能导致业务分散,最终消耗资金却未能转化为业绩。
他曾提出需要开发新的AI算法体系,包括世界模型和Agent,以实现效率的百倍提升。在谈及AI与1998年互联网的相似性时,他解释了物理世界AI数据缺失的问题,以及VLA和世界模型技术路线的结合。他还就教授创业发表了看法。
AIR每年6月在无锡举办“太湖对话”论坛,今年已是第三届。在论坛前夕,张亚勤与暗涌Waves就AI相关话题进行了交流。
第一部分:教授创业的机遇与挑战
张亚勤认为,当前AI创业高度依赖技术,教授在其中扮演着重要角色,中国已有教授能够做出世界级创新。他将教授创业分为三种模式:全职投入、以技术转化为主但不过度管理公司、以及在职兼顾公司管理。他认为第三种模式成功的可能性极低。
他表示,第一种模式有成功案例,如高通的创始人,以及AIR教授彭建创立的华深智药。然而,他强调“大部分教授不适合经营公司”,即使全身心投入,教授创业担任CEO的失败率也远高于普通创业者,这在中美都是普遍现象。他解释说,将研究转化为技术、技术转化为产品并实现规模化推广,中间存在巨大的鸿沟,很少有人能同时精通前沿研究和商业化运作。
AIR教授创业多采用第二种模式:教授作为联合创始人或首席科学家,以技术入股孵化企业,同时寻找懂商业和工程的CEO进行市场化运作。这种模式能发挥教授的技术优势,并兼顾企业发展需求。
张亚勤提到,全职创业风险极高,可能导致科研和商业两方面都受损。AIR的定位是科研机构,而非孵化器,其主要目标是做科研和培养人才,而非大规模孵化项目。
他认为,培养能够胜任CTO或顶级架构师的人才,关键在于让他们在成长阶段就具备产品和系统思维。AIR通过与字节、阿里、百度、比亚迪等20多家大企业合作,让学生参与前沿研发和规模化验证,以弥补校园研究的不足。
对于寻找合适的CEO,张亚勤表示,虽然理想状态是为每个团队匹配CEO,但这非常困难。他认为CEO不一定是职业经理人,也可能是连续创业者或团队中的年轻人。他表示,AI领域人才相对容易找到,但真正稀缺的是那些在产业中有深厚积累,又能理解AI技术的人。他强调,CEO必须具备强大的信念感,才能应对创业过程中的重重困难。他重申,1500亿的估值数字意义不大,企业最终还是要依靠技术实现商业化,并产生收入和利润。
第二部分:AI产业与公司泡沫的辩证
张亚勤认为,创业公司获得高估值应保持高度警惕,因为市场期望越高,需要证明的东西就越多。他常在学院里“泼冷水”,要求创业团队明确要解决的问题、AI的适用性以及产品的付费方。他指出,短期高估值并不代表成功。
他以机器人和大模型赛道为例,预测机器人领域几百家公司最终可能只剩20家,大模型领域国内可能只剩三四家。他回顾了互联网泡沫时期,当时资本市场比现在更狂热,但许多明星公司迅速消失。
他认为,创业需要充足资金,但钱并非最关键因素。他强调创业“九死一生”,必须聚焦。如果过早拿大量资金却目标不明,最终可能烧光钱却无业务成果。他相信,拥有优秀产品、独特技术、强大团队和清晰前景的企业,自然会吸引到投资。
张亚勤指出,当前AI和具身智能领域的火热氛围与上一波互联网创业有相似之处,但也有不同。他解释,与多数互联网公司初期缺乏规模化收入不同,本轮AI头部公司如OpenAI、Anthropic的收入增长速度前所未有,这增强了市场的信心。但他不确定这种高增长能否持续。
他提到,全球科技巨头在数据中心和芯片等领域的巨额投入,是基于对未来的高预期。然而,这些投入能否转化为实际订单和收入仍需验证。他认为未来2-3年是关键的观察期,如果巨头的收入增长未能达到预期指数曲线,整个循环将受到影响,大公司受挫,小企业则会更加脆弱。
在技术周期对照方面,张亚勤将当前AI发展阶段比作1998、1999年的互联网兴起时期,当时雅虎等公司受到追捧。他重申,“AI没有泡沫,但AI公司和估值会有泡沫”,短期的资本炒作缺乏意义。他主张企业应专注自身,愿意承担艰苦工作,用结果证明价值。
第三部分:机器人应用与AI风险
张亚勤预测,通用家庭和服务的机器人可能还需要10年以上才能成熟,但在特定场景下,如自动驾驶(本质是“开车机器人”)和工业机器人,进展会更快,技术难点已基本突破,主要剩下工程化和商业化问题。家庭机器人面临的环境极为复杂,需要与人交互,理解意图并完成动作,这涉及到尚未完全解决的科学问题。
他将智能分为数字智能、物理智能和生物智能。数字智能发展迅速,得益于互联网积累的海量数据、Scaling Law以及算法和算力。而物理智能发展较慢,原因包括物理世界数据相对匮乏、场景分散,以及数字世界的“比特”与物理世界的“原子”结合的复杂性。原子世界不遵循摩尔定律,机械结构控制也非仅靠算力可解决。
为解决数据缺失问题,他提出几种途径:学习人类第一人称视角交互数据、机器人自主采集数据、以及在仿真环境中生成数据。但他强调,仿真环境的成功不一定能直接迁移到真实世界。他提到AIR周谷越教授在“Real-to-Sim-to-Real”(真实到模拟再到真实)闭环上的研究,认为这是未来突破的关键。
面对物理世界数据缺失,他认为VLA(Vision-Language-Action)和世界模型是当前讨论的热点技术路线。VLA借鉴大语言模型方法论,但动作描述的精确性是挑战。以视觉直接产生动作,语言作为辅助是另一种思路。世界模型则旨在让机器真正理解世界,有多种实现方式,如模拟器。他认为最终可能需要结合这两种路线。
他解释“两种路线的结合”时指出,机器人面对的环境复杂,自动驾驶偏向视觉端到端系统,而很多机器人需要理解语言指令,并依靠视觉决策转化为动作。他提到AIR詹仙园团队的X-VLA系统,尝试对不同机械臂和机器人的能力进行“归一化”,实现技能泛化和跨设备迁移。同时,也有团队通过观看大量视频来理解动作和环境。他认为,在通用性要求不高的特定场景,应优先解决实际问题。
张亚勤建议,机器人应首先应用于能提升真实生产力的场景,承担危险或艰苦的工作,例如在煤矿、地下管网和电网等领域。他强调,AI和具身智能应以“帮助人”为目标,而非取代人的工作。
对于当前AI领域追求“超级智能”和“通用AI”的趋势,他认为作为科研目标可以,但从社会和企业角度,应更关注解决具体问题。他警示,过度追求智能上限,若无明确目标,可能导致风险不可控。他质疑AI是否必须“学人”或“超过人”,并指出AI在放大能力的同时,也可能放大人性中的负面因素,带来安全和伦理风险。
他列举了AI主要的三类风险:失控、滥用和系统性风险(包括社会问题)。他目前更关注失控和滥用。他指出,AI系统复杂性增加,许多机理是黑箱,且具备行动能力的Agent正走向现实部署,存在自主复制和逃逸的风险。他以Anthropic披露的Claude Mythos模型为例,说明其识别软件漏洞的能力可能导致大规模网络攻击。
因此,他强调AI产品和技术在设计之初就应明确其要解决的问题,以增强AI的可控性。他重申,AI的最终目的是帮助人类,提升生活质量。
2024年6月10日 . 下午2:00
我们坚信,持续的创新是驱动数字娱乐产业发展的核心动力。九游集团不仅汇聚了海量优质内容,更通过技术革新与用户洞察,持续优化互动体验,确保每一位用户都能在这里找到属于自己的乐趣。
内容前沿
2024年6月15日 . 上午10:30
九游集团坚持以用户为中心,提供贴心服务。我们不断探索数字娱乐的新可能,从平台资讯到内容方向,再到发展历程,每一环节都凝聚着我们的匠心与对卓越的追求。