图片

2021年,将搜狗卖给腾讯后,王小川奔赴下一个旅程。

 

在卸任搜狗CEO的内部信中,他写道:“往后二十年,若能为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,生命就更有意义了。”

 

后来采访中,王小川透露,那段时间他“读了上千篇医学论文”。

 

2023年4月,ChatGPT发布131天后,百川智能成立,志在打造「中国的OpenAI」,之后的一年时间,公司达成了每个月都有一款大模型对外面世的成就。

 

2024年年中,百川智能完成50亿元A轮融资,并且将以200亿估值开启B轮融资。

 

令人意想不到的是,获得巨额融资的百川智能,迅速调整了业务重心,放慢了在通用大模型的竞逐脚步,Baichuan 4发布10个月未有大的版本更新;更加聚焦在医疗业务,官宣了与北京儿童医院的合作,推出了具备医疗循证能力的Baichuan-M1-preview。

 

尤其是,今年3月,百川智能负责金融领域To B业务的团队被曝已被裁撤,更被外界视作是公司“全力押注医疗”的战略信号。

 

针对这样的抉择,有人表示支持,当然也有不少质疑的声音,折射出关于AI医疗技术与商业化路径的深刻分歧。

 

当然,无论两方如何争论,在这场大模型创业的激战上,没有什么能比得上创始人自己的思考来得更有价值。

 

我们搜集了王小川自创立百川智能以来的公开访谈和分享,整理出他关于AGI、医疗、商业模式、团队建设方面的思考。

 

这些内容既勾勒出一位创业者的心路轨迹,又映照着一名技术理想主义者的行业洞察,更为当下火热的AI医疗赛道提供了一份可供参考的启示。

 

造医生就等于AGI

 

1. 所以对百川而言,如果往 AGI 走,依然是要做智能,背后就是语言,这个立场是没有变过的。

 

2. 今天的问题不是在于大模型无法赚钱,而是要找到通向AGI的道路上,沿途有什么好场景可以赚钱。

 

3. 什么样的场景才算和AGI的目标有关系?第一,这个场景要足够终极,成长性足够大,要让大模型走到AGI的时候,才能让这个场景的实现达到完美的程度。但同时这个场景的起点又要相对比较低,哪怕没有达到AGI,这个场景也已经可以产生价值,切入广泛人群了。
4. 之前大家觉得图灵测试无法用语言分辨出人和机器了就可以称为智能,那今天我们对于AGI 的定义就是如果你能造出一个高水平的医生了,就是达到AGI了

 

5. 造医生就等于AGI医生是 AGI 的一个子集,大模型所有的能力在医生上都用得到,比如说推理能力、减少幻觉的能力、沟通能力、共情能力、多模态的能力、记忆的能力。

 

图片
6. 问诊是最核心的能力,问诊今天还是刀耕火种,还在靠医生这张嘴,没有被标准化过,问题问得不对,就得不到好答案。但有了大模型,它可以按照诊断的SOP(标准化流程)来提问,这可以充分展现它的能力。

 

7. 我们在“造人”,不是在造工具。大家开始提的概念叫助理,助理就是错误的理解,今天我们是造顾问,它比你更有知识。

 

8. 我们今天做 AGI,核心就是通过知识密度扩大知识的供给。医生的供给不是靠生产关系,像滴滴、美团帮你撮合下就够了的。就像骑手,有些人工作不顺利,一不开心去当骑手了,但没法说一不开心就去当医生。这个供给是 AGI 重要的市场空间。

 

得医生者得天下

 

9. 娱乐应用杀时间,效率工具节省时间,而医疗能延长时间。所有东西都在变得越来越便宜,越来越容易获得,但医疗和健康却在变得越来越贵

 

10. 医疗是大模型皇冠上的明珠。因为医疗行业的需求是无限大的,模型再大,医疗都需要;以及医疗的智力密度是足够高的。
11. 上一代互联网的本质,是在解决信息传递、改变生产关系的问题。但是医疗不是这样的,医疗是供给驱动的,医疗领域最缺的资源是医生,但医生的供给是有限的,所以上一代互联网做挂号什么的,也没有意义。

 

12. 上个20 年,整个VC投了1000亿也没做起来互联网医疗,核心是因为只能围绕医生做周边:帮医生写论文,帮医院做信息化……这些模式都不成立。找医生不如造医生。

 

13. 医疗行业核心是两个事情需要解决,一个是医生不够,另一个是缺乏足够多临床研究,有更多的高质量数据,能得到医学上的认知。

 

14. 我是因为医疗来做大模型的,不是用大模型做医疗。在应用驱动侧,我认为医疗是这波变革中最大的,甚至是唯一的应用。

 

15. 医生是一个顶天立地的场景,立地是它对服务有意义,顶天是它对大模型有需求。我们砸大模型,至少有一根支柱,确保模型的技术能力变成场景的壁垒。

 

16. 任何一个 AI 技术在医疗上都有用武之地:复杂诊断需要推理能力,需要减少幻觉;全病程管理需要长窗口记忆,未来甚至可以记录一个人一生的健康信息;理解医疗影像、听诊等需要多模态;询证、查论文需要 RAG(检索增强生成)等;甚至未来手术机器人也需要具身智能。

 

17. 我们做医疗的话,会把它类比成无人驾驶。无人驾驶也是之前大家觉得特别难的一个题目,但是大家对无人驾驶也很看重。医疗其实是一个比无人驾驶更有价值的事情,医生的供给要比司机少很多,同时又跟生命健康高度相关,因此它的价值就足够大。

 

图片

图:类比自动驾驶,医疗发展的六个层次

 

18. 我们认为今天医疗行业在AI加持之后的话,可以做到 L1-L2 之间,比 L1 好一点,但是离 L2 还有差距。但是我们判断,以现在大模型的技术加上其它技术的引入,是有机会做到 L3。(2024年6月)

 

19. 医药最大的难点是,必须用人做实验,医生一定要介入这个环节,所以临床才是获得认知和服务的中心舞台……医生既是临床服务者,也是科研工作者,因此在中国叫「得医生者得天下」,者也是求医生,药厂也要去找医生,但医生供给的量非常有限
20. 在美国只有两个行业,它的价值是越来越贵的。其中一个就是医疗服务,人的需求是无限多的,自古到今,医疗再多供给,人都有需求。

 

21. 实现“造医生”后,整个医疗路径将发生大的变革,以医院为中心将演变为以居家或社区为中心。

 

22. 儿科对改变路径的需求最为迫切。小朋友隔三差五就生病,家长不放心就请假去医院,甚至半夜要去急诊,去了还可能交叉感染,其实80%的儿科疾病是不需要去医院的。儿童的家长相对年轻,更容易拥抱新技术。因此儿科会成为 AI 医疗里最快产业化的一部分

 

23. 未来都会参与到医疗的哪些环节?短期肯定是先让儿科医生和全科医生往基层走,使患者就诊的路径得以改变。再往下走,就能让医生有时间干更多事,这样对科研也会有帮助。最终,医学模型是知道什么样的人该给什么样的诊断和干预方法,在精准医疗里找到个性化的范式。

 

24. 医疗领域的落地,2025年就会是一个重要节点,医疗会是 AI 较早解锁的主要场景,而不是像一些人想的是更晚的场景。

 

最终买单方将是政府、保险和个人

25. 商业化的路径有两种弯路:一种是立刻就赚到快钱的,你写个广告文案、写个PPT效果很好,没问题。但这只是一个小应用,在技术迭代过程中,不会成为主旋律。另一种,觉得训练模型之后场景自然会来,这个我也不太认可。
26. 今天API收入和模型本身的收入,都不叫成功实践,不是我们要追赶和类比的情况,我们认为这两个东西今天不是最性感的商业模式。文心一言也好,ChatGPT也好,都不是。

 

27. 我现在做的事短期可能是医院买单,但最终的买单方应该是保险、政府或者个人。

 

28. 整体看,商业模式有 3 个方向:第一是 G 端(政府端),本身有基层公卫费用,会支持家庭医生计划和公立医院改革。第二是H 端(医院),最终会走到医保里。比如去年底,AI 辅助诊断首次被国家医保局列入了服务项目的立项指南,而且它不是算在医疗器械费用里的,是在医生服务费用里。第三就是 to C,可能从每个人付费走向多层次商业保险。此外未来还有一个很大的机会,是出海

 

29. 我们不是帮助医生,是造医生,改变大家的就诊路径:从院内走向院外,甚至从线下走到线上。医生对我们而言是朋友关系,但不是我们的服务对象,他是我们的合作伙伴。

 

Hospital at Home: 4 Considerations to Ramp Up Your Program
30. 围绕医生做周边容易变成外包,而如果是造医生,那核心价值在于超级医生模型。一开始可能要做得要重一些,但头几个客户跑完后,一些非核心模型的部署工作就可以找 ISV(第三方的软件合作商)去做了。

 

31. to B,在中国天花板远远低于to C。我们相对保守、收敛。我们现在主要To C,To B占20%左右,很小的一个比例。(2024年4月)

 

32. 我认为 B 端天花板不高,但确定性是挺清楚的,就是确实很多企业都有这样的一个需求,只是它的对接门槛很高,每个企业有自己的私有数据跟你怎么连。所以如果你没一个好的合作模式的话,最后可能把双方都拖垮掉。

 

33. 光做to B无法养活百川,核心拼的是超级应用。to C我提了三个词:创造、健康、快乐。在C端做事,如果没有厚度,只是在做模型as service这件事情,在共识里面创业公司是没戏的。

 

34. 落地不等于商业化。你得更有应用导向、场景,在场景端先把价值创造出来,这就叫落地。无论是百度还是抖音,第一天也不是先商业化。

 

35. 我们融的钱,按照现在的进度,也足够支撑很长时间了。(2024年4月)

 

最关键的数据来自顶尖医院

36. 医疗是各个行业里数据量最充分的行业,没有之一。这个行业已经有一定的数据沉淀,数字化也做得不错了,很多行业数字化都没有。

 

37. 如何获得足够丰富和优质的医疗数据?首先是和医院合作,还有一些医学杂志和数据库也有大量公开优质数据。

 

38. 从case study、RCT再到后面的Meta分析,以及大量的论文、医疗指南、专家共识等这些医学领域知识的总结都能够成为大模型的数据,这个训练集是足够的

 

39. 最关键的数据还是来自顶尖医院,质比量更重要。多大程度上有数据飞轮,需要实践更久之后才好回答。

 

40. 在医疗领域做超级模型比做通用模型的成本更高,因为需要更多医疗数据。做到 “入院即入组” 甚至 “出生即入组”,就是对病程乃至整个生命过程的每一个医疗干预做完整记录,这会产生海量数据,它们又会成为 AI for Science 的基础,推动生命科学发展。

 

 

不看好医疗开源

41. 从 ToB 的角度,开源、闭源都需要,不是这样的竞争关系。我们认为,未来 80% 企业会用开源的模型,在自己的数据里去优化。(2023年8月)

 

42. 我不认为开源会做出最好的模型。而且要分具体场景,医疗开源是不会做好的。(2024年3月)

 

图片
43. DeepSeek 的开源会改变行业格局,中国离实现 AGI 和应用爆发更近了。另外 DeepSeek 的出圈让更多人体验到了 AI,教育了行业。原来我们还想,要怎么让卫健委和医生能理解今天 AI 的医疗推理能力已经很强了,现在这会更容易。

 

44. 开源让医疗科研人员能很容易上手模型、做调优。也能帮我们和医疗行业建立透明和信任的关系。(2025年2月)

需要更多年轻人

45. 医疗圈的人,之前最大的特点就是做“伤”了,讲什么都不兴奋。对我来讲,核心是需要让团队对医疗有更多的理解和信仰。

 

46. AI 人才和医疗人才怎么协作、分工、融合?一是做技术的人要会提医学问题;二是,医学背景的人会参与设计模型评测体系,他们要学习对数据的概念

 

47. 创业公司先天有优势。第一,大家都知道模型做不好,公司做不好,大家都挂了。在一条船上,都在驾驶舱。第二,大家能有充分共创,不是老板和员工的关系。大厂这方面难很多。

 

48. 今天的大模型不是靠技术理想主义推动的一件事,需要更多对现实的考虑,对技术通盘的看法,甚至有人文哲学高度的一个组织

 

49. 我们这次创业发现,在很多技术定义上,3年、8年的这种经验没用。现在做大模型最好的就是刚刚毕业的博士生,而且之前就是参与大模型研究的。经验越多,可能变得包袱越大,需要更多变化调整。

 

50. 打造组织需要更多年轻人,接下来技术团队需要更年轻化,吸收更多博士生和应届博士,医疗人才则需要更多的经验。

 

 

—The End—