打卡智能中国（五）：博士都去哪儿了？-蓝鲸财经

文｜脑极体

《打卡智能中国》系列更新了几期，有读者表示，很爱看这类接地气的真实故事，也有读者反映，不是电工，就是文员、农民、治沙人，人工智能不是高精尖学科吗？那些学历很高的博士都去哪儿了？

答案是：他们在地里，厂里，矿里呢。

中科院的林博士，我见过他两次。

第一次是2020年，某AI精英培训班的开学典礼。当时，林博士对AI的了解，还停留在“深度学习的皮毛”，他调用平台的机器视觉模型，开发了一个识别动物的模型，他说：“可以识别的种类还比较少，我来也想看看其他学员都用AI做些什么工作，跟大家多学习。”林博士那次介绍这个AI产品时，还有些没底气。

第二次是2022年，在一个普通的会议室采访间，林博士的言谈内容，变得自如和丰富了很多。

“之前的那个生物识别应用，这几年已经多出了好多个模型，扩展到了哺乳动物、两栖爬行、昆虫科一级、蝴蝶种一级的识别，”他说，“我们还用AI做了别的事，一个是野外生物的图像采集和自动化识别，一个是通过声纹识别来进行野外动物保护，目前设备已经弄好了。我们还支撑别的企业去做AI商业化应用，比如农业病虫害的识别”。

两年时间，林博士从AI新手成长为AI熟手，也从一个坐在电脑前搞研究的学者，多了很多上深林、下农田的经验。他眼中的AI，倒映着智能中国的上限与纵深。

今天的故事，是科研领域的博士，怎么从零开始用AI、做AI。

研究所里的AI，有什么不一样？

科研领域的智能化，与工农商等行业既有相同点，也有不同点。

相同点在于：1.缺人；2.缺数；3.缺场景。

科研领域汇聚了大量高学历人才，但依然缺少能将AI与细分学科相结合的复合型人才。就拿林博士来说，他本身是信息学专业的，因为生物研究要用到计算机分析等信息技术，才加入了中科院下属的动物研究所，对于深度学习、图像识别、声纹识别等人工智能技术，他也要从头学起，迭代自己的知识体系。

此外，研究型机构大多有一定的数据积累，但也分领域、分专业甚至分物种。比如林博士想做的物种识别、鸟类声纹识别等AI应用，很多珍稀动物，别说语音资料，连野外活动的图像，数据库里一共都没几张，而缺少充足的数据，AI很难发挥作用。

还有，科学研究的哪些课题、方向能用到AI，这也是一个需要科学家们发挥“主观能动性”去摸索的东西。林博士提到，很多科学研究中已经有很成熟的计算工具了，要用到AI肯定是要从一线科研人员开始推动，这就需要自己有一定的想法，他说：“所以我听说有这个深度学习人才培训，就带着我的课题主动来报名了，希望能顺利毕业。”

当然，AI+科研也有其特别的地方。

比如，特别没钱途。

第一次见面，我好奇地问，“当下AI跟生物的碰撞多不多？”林博士笑言：

“AI在医学领域应用的很快，但在生物识别方面就没有那么好，可能跟动物保护这种基础性研究的商业价值不大有关系，投入上有一定的滞后性。”

玩笑归玩笑，AI与科研的结合也特别重要。

林博士的经历证明，基础研究领域的AI创新一旦成长起来，可以带来产学研用的一系列联动效应。

2020年，林博士刚刚做出了一款识别动植物的科普类App，集成了计算机视觉技术和他们单位的动植物百科资料，方便一些动物爱好者、野外观测调查员以及小学生和家长们使用。

中国领土广阔，专家考察有一定的时间线，比如每五年一次，很可能就会错失某些物种的观察机会，导致采样到的数据是有偏差的。而且生物领域的分类学家、人才也处于萎缩状态，越来越少人愿意从事这样艰苦的野外工作，所以全靠研究者和野外工作者去采集和分类，是非常不现实的。

通过智能技术的创新应用，聚集起更多数据合作伙伴，发动机构乃至广大用户一起参与进来，对于生物保护和研究的开展很有帮助。

而这样一个纯公益的工作，随后也凝聚起了很多研究机构、公益组织以及企业/产业界的关注。

林博士告诉我，开发完那个App之后，很多类似的国际动物保护机构跟他们建立了很好的联系，他们输出技术，而对方将获取的生物数据资料反馈给他们，让他们获得了几十万的影像数据，其中很多都是新增的观测点位，相当于给国家节省了好多科研经费。

可持续的数据获取机制，对于后续科研任务的开展是非常重要的。

除此之外，他们还吸引到了一些商业化项目方，前来寻求合作。

比如有企业知道他们有这个技术，找到他们想开发一种害虫识别的系统，恰好林博士所在的单位本身也承担着病虫害防治工作，有做好粮食安全保障的职能。于是双方一拍即合，开始搭建病虫害的数据库，进行识别算法的开发。

相比跟经济价值更近的工农商业，科研领域的智能化看起来好像没那么紧迫，却有着“创新发动机”的作用：影响的不是一个人、一家企业，而可能是一个行业（比如上文提到的农业）、一个群体（比如科普教育）乃至一个国家（比如学科人才建设）。

从象牙塔到农田：一个博士的脚步

此前报道中的电力工人、水厂员工都是AI应用末端环节的一份子。

而借助林博士的脚步，我们可以看到，一种AI能力是如何诞生的又如何抵达应用末端。

第一步：从零做数据。

接收到企业提出的识别病虫害的需求之后，林博士发现，数据就是一个很大的挑战。

从生物学的角度，害虫也有很多种，一种害虫的发育过程中还有很多种形态，从虫卵、弱虫、幼虫、成虫的发育状态都不同，在图像分类过程中就属于不同类别，如果是外行人来做，根本做不明白也没有一个成型的数据库。

所以林博士和团队，必须从电脑桌前走到地里，去实地采集不同阶段的图像，确定病虫害不同发育阶段的形状特征，为后续模型的精准识别打下基础。

第二步：跟农业专家深入交流。

不同地区的病虫害可能并不相同，里面涉及到很多非常专业的知识点，比如北京郊区的番茄有哪些常见的病虫害？发现害虫后会对接怎样的防治措施？提供什么药物？这都要深入到大棚里，跟当地的植保专家以及长期从事一线生产的农民们进行交流，这样才能保证后期打造的AI系统，能够提供从病虫害识别到防治指导的全套工作。

第三步：模型开发与调优迭代。

林博士和同事们基本都是信息学专业，并不是深度学习算法工程师出身，而农业项目的模型迭代又很快，一批图像采集完了之后，马上就要迭代一批模型，为了精准识别不同作物，还要开发不同的模型，这样模型很多，开发和迭代工作量很大。

林博士表示，科研工作中可能很看重AI开发框架的灵活性、可扩展性、先进性等，比如为了发paper便于同行复现，大家更倾向于使用TensorFlow、PyTorch这样的海外平台，而真正在开发产业用模型时，我们更看重的是平台的易用性，以及面向应用的工业化能力是不是很简单易用，有没有已经训练好的性能不错的模型。

因为底层的技术手段、理论方法，国内外开发平台都是一样的，也都是开源的，没什么区别，但容不容易训练，容不容易部署，能不能工业性地批量生产（模型），这些问题的答案对产业智能化很重要。

目前，由林博士及团队支持的该农业病虫害应用已经在北京落地了，这也是北方地区第一款病虫害识别的App。

为什么做这个项目？林博士及团队的出发点和商业公司的想法就不太一样——一方面是企业/农户有需求；另一方面是为了帮助新农人。

“现在大量的新型农业生产者，比如年轻一代，”林博士提到，“他们没有熟练的生产经验，也不依赖上一辈传授的经验，而是更依赖从互联网获取的信息。这时候我们给他提供一个工具——AI识别，慢慢地他们也会成长为有经验的生产者。”

以往《打卡智能中国》的主角，电力工人放飞的无人机，水厂员工日常使用的智慧系统，这些AI工具背后就是无数个林博士。

学员？导师？研究员？开发者？一个AI人的身份转换

第一次见到林博士，他还是一个带着课题等待被评判的“AI新手学员”。

第二次见到他，已经是国内某AI开源社区的技术专家了。

林博士平时还会承担一些新手指导、开发经验分享等任务，把自己的数据和模型开源放到平台上，让开发者和学生用户有实践和练手的机会。

培养多一点AI人才，这种“利他”的思维，好像就刻在这位学者的脑子里，不用犹豫和思索，自然而然地就去做了。

AI人才需求量大、缺口大，已经是公认的事实，也成为人工智能产业进一步繁荣发展的限制。

AI人才的培养难，一是因为技术新，相较于理数生化等传统学科，以及计算机这样的成熟学科来说，AI本身是一门新兴技术，还在不断更新迭代，没有完善的人才培养模式和课程体系；二是交叉性强，AI是一门应用型技术，要求跟产业紧密结合、实践落地，仅靠学校教育是无法满足AI复合型人才的培养需求。

十四五规划中提出，人工智能行业要形成产学研用深度融合的技术创新体系，连通企业、高校、研究院所、政府等创新主体。

在AI生态里，“产学研用”是分层的，每一层都承担着各自主要的创新任务，但分层不代表割裂，各层还要紧密联动，拧成一个创新链条。

“林博士们”就成了那个游走在各层的关键角色：

在产业中，他们是AI创新的开发者；

在高校人才培养中，他们是那个给学弟、学妹指导的前辈；

在研究中，他们是将AI技术与科学探索相结合的先行者；

在应用环节，他们会主动去贴近一线使用者，让AI工具能变得更好用。

“谈笑有鸿儒，往来无白丁”这就是今天的AI学人，既有身处象牙塔兼济天下的理想情怀，又有身先士卒深入产业的行动能力。

有一个工业大学的老师曾告诉我，要把AI研究做到工厂里，这和林博士把AI做进农田里，有异曲同工之妙。

这些学者拥抱AI的经历，让我深切的感受到：AI既是一个专业，也不是一个专业。AI将更多专家和学者拉进AI的世界，“产学研用”的闭环加速转动，才能持续打开AI的上限和想象空间。

大鹏之动，非一羽之轻也，多元人才的合力，才能托举起智能中国。

声明：本文内容仅代表该投稿文章作者观点，不代表蓝鲸号立场。 未经授权不得随意转载，蓝鲸号保留追究相应责任的权利