封面新闻记者张跃曦
近年来,随着移动办公和学习需求的爆发,手机扫描市场悄然发生变化。根据夸克扫描王数据,用户扫描学习相关内容数量长期排名第一;在过去的一年中,工作场所中扫描内容的数量增加了两倍。同时,Z世代的用户不仅要求扫描清晰,而且对编辑、分享、存储甚至创作都有更多个性化的要求,而传统的手机扫描已经很难满足这种变化。
随着AI大模型技术逐渐深入到应用层面,手机扫描的功能和体验迎来了全面升级。8月29日,记者了解到,阿里智能信息事业群推出搭载AI大模型技术的手机扫描产品“夸克扫描王App”,集高清扫描、文字提取、格式转换、笔迹去除、自拍拍照等20多项功能于一体,能够精准高效地识别、分析、理解复杂内容。
AI的大模型技术能力如何赋能扫描?据悉,基于大语言模型的结果优化,可以在复杂场景下模仿人类思维,更准确地识别、分析、提取文字、公式、图片,从而达到更好的扫描效果。记者体验过程中发现,当扫描文本出现阴影或破损时,结合数据库中的训练样本后,可以根据上下文的语义分析进行匹配定位,从而扫描出清晰、平整、有逻辑的电子文档。
据相关负责人介绍,过去一年,夸克扫描了王紫嫣的AI模型,通过海量图形数据的训练,首次将多模算法引入字符识别领域,大幅提升了公式识别和手写识别的效果,印刷体字符识别准确率达99.99%,手写字符识别准确率超过98.5%。同时,在文档扫描的模型开发中引入了游戏引擎数据模拟方法和半监督模型训练方法,可以提高文档校正、笔迹清晰和背景杂质擦除的效果。扫描是用户将资产数字化的重要场景。借助AI大模型的能力,一方面可以让扫描的内容展现更好的效果,同时也给用户更多的自由创造空间,从而帮助用户在扫描场景中提升质量和效率。
今年是非常关注大模型的一年,而企业场景和行业应用是高频词。大模型的应用场景不断丰富。比如阿里云依桐万象可以辅助人类创作图片,可以应用到艺术设计、电子商务、游戏、文化创意等应用场景。在MaaS circuit上,腾讯云公布了行业模型的生态计划,依托打造行业模型精选店。百度也曾公开表示,文新千帆大模型平台将作为大模型生产平台,允许企业基于任何大模型开发自己专属的大模型。
据不完全统计,到2023年5月底,国内已经发布了79个10亿级参数的大模型,“自研大模型热潮”仍将持续。华西证券表示,对于头部科技公司来说,基于现有的禀赋布局AI模式,将是未来重要的收入增量。在供给端持续爆发的情况下,应用端有望爆发,服务场景有望进一步拓宽。