收藏文章 楼主

马占山自嘲有“严重拖延症”

版块:科技头条   类型:普通   作者:科技资讯   查看:41   回复:0   获赞:0   时间:2023-05-31 05:21:11

■本报记者 沈春蕾


“因为专利申请耽误了本文的发表,如果早几年投入,也许可以投入科学、自然、细胞。”


近日,《医学病毒学杂志》在线发表了中国科学院昆明动物研究所(以下简称昆明动物研究所)研究员马占山的一篇论文,提出了一个比较病毒组(VC)新算法具有高效发现病毒组独特或丰富的病毒类型的功能。《医学病毒学杂志》目前的影响因素是20.7,在病毒学领域排名第二。


近日,马占山在接受《中国科学报》采访时讲述了文章发表背后的故事:“2017年1月,我申请受理的专利在2022年第一次审查中被驳回,所以我错过了发表论文的最佳时机,但我仍然很高兴这项研究成果能够公开发表,我将继续申请专利。这次发表的结果只是这项技术研究的一小部分。”


距离第三个博士学位“只有一篇论文”


“在那些日子里,我不想让别人知道我们的技术研究。一开始,我没有申请专利的计划,甚至想过是否用技术开一家公司。”论文中唯一的作者马占山说。


在解释为什么只有一个作者的同时,他有点遗憾地说:“现在看来,我的研究并没有那么先进。至于作者只有一个原因,首先,我的学科组很少,毕业博士生至少有45篇论文,超过10篇,其他人已经作为沟通作者发表了论文;第二,只有两个人完成了论文的研究方法,这次只发表了方法的一部分,其他论文仍在审查中,但这篇论文首先发表了。”


采访前一天晚上,马占山工作到凌晨3点,但在采访中,他的脸一点也不累。


马占山不仅是一个“工作狂”,也是一个“跨境”人才。他拥有昆虫学和计算机科学博士学位。他在硅谷当了10年软件工程师。2010年回国加入昆明动物研究所后,从事计算生物学研究。本文是马占山“跨境”研究的产物之一。


1997年7月,马占山在爱达荷大学完成了昆虫学博士论文,并通过答辩成功获得学位,但该论文当时没有公开发表。同年12月获得计算机科学硕士学位后,他加入了行业,2006年回到爱达荷大学攻读计算机科学博士学位,仅26个月就获得了第二个博士学位。


2008年,马占山成为爱达荷大学的研究人员。这时,他拿出写了近10年的昆虫学博士论文,并成功发表。在接下来的两年里,马占山在昆虫学领域的一流期刊上发表了7篇论文。“这些文章很早就开始酝酿,但还没有完成。”马占山嘲笑自己有“严重的拖延症”。


当时,马占山的计算机科学博士论文受到施普林格的青睐。双方于2011年签订了一份出版优秀博士论文系列的合同。后来,他们同意在马占山补充和改进论文内容后出版。”另一边还在等我提交手稿。”马占山尴尬地告诉《中国科学日报》,核心算法已经被搁置了七八年。


在“拖延”的同时,马占山仍在继续学习。当马占山即将获得计算机科学博士学位时,他仍在考虑是否应该获得另一个金融和数学博士学位。事实上,在此之前,他已经选修或参加了大部分数学博士必修课程。用他的话说,“离学位只有一篇论文”。


最有价值的专利申请被驳回


马占山说:“我可能在2016年左右开始思考VC算法,主要关注它的应用前景,并急于申请专利。”,“如果你先发表论文,这意味着开放VC算法,这可能会影响专利的新颖性。”


马占山选择专利申请专利并发表论文。


到目前为止,马占山已经申请了近20项专利。仅2021年,马占山学科组就授权了6项发明专利。但令他“难过”的是,近年来,他的三项专利申请被拒绝,都是他认为最有价值的技术,包括VC算法的一部分和两项关于母乳菌群的技术。


“马兄弟,我看到美国治疗乳腺炎的指南非常接近你的论文。你的专利怎么样?”2022年,马占山接到了成都妇幼中心医院乳腺外科主任宁平的朋友和电话。这个电话的原因是2017年左右,宁平和其他人来到昆明参观马占山学科组,因为他们在阅读了马占山关于乳腺炎原因的论文后非常受到启发。


马占山有时并不在乎别人的意见,在研究的世界里,他一直在追求极致,这就是为什么他的许多文章在推迟10年后仍能顺利发表。


比较两个或两个以上的病毒组,发现其独特或丰富的病毒类型是一个看似简单但实际上复杂的计算问题。马占山告诉《中国科学报》,类似的问题属于计算机科学领域的NP-hard问题。


马占山是推销员最短的路径(TSP)以问题为例,介绍了什么是NP-hard问题。TSP问题最早提出于19世纪,销售人员需要访问N个城市,但禁止重复访问。销售人员希望获得最短的路径,以节省时间。如果是一个位数以内的城市,小学生甚至幼儿园的孩子都可以给出答案。但当城市增加到一定数量时,问题的难度就会急剧上升。


“简单地说,对于这些问题,当规模达到一定程度时,即使用最强大的计算机也可能无法获得最佳解决方案。”马占山选择挑战这个问题,并成功地开发了VC算法。


马占山表示,VC算法可以为病毒组的比较研究提供一套全新的算法和软件技术。


希望这次不要再拖延了


马占山学科组自回国以来,一直专注于基因测序软件的开发。他告诉《中国科学报》:“当时,第二代测序技术占据了绝对市场。我们与马里兰大学叶承羲博士合作,开发了一种用于第二代测序的算法和软件,将其命名为Sparseasembler。软件发布后不久,华大基因采用了我们的算法,将其旗舰软件Soapdenovo升级为Soapdenovo-II。该算法可节省计算机90%的内存。”


2012年至2016年左右,随着第三代基因测序技术的出现,马占山与叶承羲进一步合作,发布了另外两款软件——DBG2OLC和Sparc。他介绍说,这两款软件大大缩短了测序时间,从当时主流的数十万CPU小时缩短到数千个CPU小时,是第三代测序软件技术领域的重大突破,其核心算法后来几乎被所有的第三代测序所采用。


2018年,马占山学科组还与其他团队合作开发了一项技术,将第四代测序技术与10x-Genomics测序技术相结合,实现混合组装,可降低第四代测序成本70%。他还提到,“我们已经申请了这些技术的专利,其中一些已经授权,但显然没有时间探索专利权利保护。”


谈到专利,马占山很感动:“我曾经在一家芯片巨头公司工作过,但后来我发现这样一家大公司也有技术不够高的困境,甚至有很多专利来弥补这个数字。所以我选择加入硅谷的一家初创软件公司,该公司依靠一项专利使股票市值达到30亿美元,但最终陷入了互联网泡沫。”


马占山的巨头公司是一家需要支持10万名员工和三班倒的芯片制造商;初创公司没有蓝领。这是一家纯软件设计公司。许多员工来自斯坦福大学和加州大学伯克利分校。但白领仍然输给了蓝领。也许这就是所谓的世界。


这两次工作经历让马占山明白,光有专利这把利剑在行业内生存是不够的。


“依靠软件,我们很难发表高影响因素的论文。”2018年之前,马占山学科组的评估一直是B,这也让他开始暗自担心学科组的未来和命运。


因此,马占山将研究重点转向菌群医学生态学。2019年,马占山学科组迎来小高潮,连续发表3篇9分以上论文,学科组考核由B升至A。


菌群医学生态学为马占山赢得了另一项荣誉—美国哈佛大学于2020年2月授予马占山Bullard Fellow奖。该奖项始于1959年,每年从世界各地挑选5至7名成功的高级访问学者,资助他们在哈佛进行为期一年的讲座和合作研究。


由于疫情原因,马占山访问哈佛被推迟到2023年至2024年。他将在哈佛写一篇关于菌群生态和进化的专题文章。“我走了两次别人走的路。”马占山叹了口气,很多结果因为各种原因错过了第一次发表,结果几年后又要走发表的过程。希望这次不要耽误。


相关论文信息:


https://doi.org/10.1002/jmv.28682

 
回复列表
默认   热门   正序   倒序

回复:马占山自嘲有“严重拖延症”

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:13.58.156.237,2025-05-18 04:43:24,Processed in 0.03555 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com