爱小说

第398章 商用级手写识别算法

小说:重生学神有系统 作者:一碗酸梅汤 更新时间:2020-04-01 02:13
爱小说(www.ixs.cc)开通手机站了,手机用户可以登录 m.ixs.cc 进行阅读,效果更好哦!
  有图科技是一家股份制公司,专业生产各种扫描仪。
  该公司出品的“宏图”系列光学扫描仪,在国内市场的占有率,一向超过60%。
  之所以卖得这么好,跟他们自主研发的“宏图OCR”软件,关系不可谓不大。
  软件研发部中,一场工作会议正在进行。
  “王工,咱们的新版OCR,还得多久能投入市场?”
  说话的是蓝战新,他今年不过40岁左右,却已在部长的位置上,稳坐了10余年。
  王仁见部长点到自己,连忙回答说:“最多一个星期。”
  蓝战新点了点头,看起来对这个答案比较满意。
  他想了想,又问:“和上一版相比,性能提升的幅度多大?”
  “3%以上。”王仁回答。
  “这么高?”蓝部长有些意外。
  王仁露出自信地微笑:“对比较干净的中文版面,理想情况下,识别正确率可超过92.8%,达到了国际先进水准。”
  蓝战新眼神一亮:“太好了!这样一来,咱们的扫描仪产品,在国内的市场占有率,一定能进一步扩大。”
  王工“谦逊”地一笑,摇了摇头:“不是我们厉害,是对手不够能打。”
  蓝战新笑了起来:“这话有点道理。有句话怎么说来着,全靠同行衬托?”
  其余人也陪着他一起笑了起来。
  没错,一直以来,市场上的其他中文OCR产品,识别正确率基本在85%到90%之间波动。
  宏图OCR已经是其中的佼佼者。
  然而,他们万万料想不到,一个打破行业规则的强大OCR软件,即将出世……
  ※※※
  虚拟空间里。
  江寒花费了上百个小时,一共学完了三本书:《电动力学》、《量子力学I》、《热力学和统计物理》。
  他的身边,也积攒了厚厚一摞空白图纸。
  当然,现在这些图纸已经不空了,写满了各种算式和习题解答。
  以江寒现在的学习速度,20~30小时一本书,一点压力也没有。
  关键是,即使连续用脑上百小时,他仍然没有感到一丝倦意。
  换成刚得到系统的时候,高强度学习、工作4~5个小时,也就差不多到极限了。
  而自从学力等级提升到“学者9星”之后,他就没发现自己精力不够用过……
  虽然消耗的冰岛红极参更多了,可是和带来的好处相比,那点金钱上的支出,完全是微不足道的。
  江寒非常好奇,不知道自己现在,到底能连续学习多长时间?
  于是接下来,他就毫不停顿地继续啃书、做习题。
  又是上百个小时过去,《粒子物理与核物理导论》、《量子物理II》、《等离子体物理》也全学完了。
  而他身边的空白图纸,也从10CM左右的高度,增长到了18CM以上。
  江寒终于有了一丝倦意,但感觉还能撑住,于是毫不停留地继续学习。
  《固体物理》、《高等光学》、《生物物理》、《流体力学》……
  一个个txt文件学完,然后连同配套的小图片集,一起挪到了“已学”文件夹中。
  不知过了多久。
  江寒学完了最后一个txt文件后,愕然发现,“物理学”文件夹已经空了。
  这意味着,他一晚之间,学完了大学物理学专业,本科阶段的大半专业课。
  当然,只是理论方面,至于实验,还一个也没有做……
  直到这时,江寒才感觉到了深深地疲倦,连忙退出了虚拟空间。
  看了眼学科经验值面板。
  物理学的进度条,只差不到1/5,就能升到高级了。
  江寒忍不住咧嘴一笑。
  这还不到三个小时,自己就搞定了十来本物理专业本科教材。
  没啥意外的话,再有个把星期,物理、化学、生物三科,都能达到高级水准。
  这种学习效率……
  “嗯……搞不好,这才是虚拟空间的正确打开方式?”
  江寒在心里嘟囔了一句,随后就昏睡了过去。
  第二天醒来,他仍感觉精神不够饱满,注意力有点无法集中。
  于是思考了一下后,起身、穿衣、下楼。
  厨房里,夏如虹正忙着做早餐。
  江寒笑着问候了一声“早安”,随后说:“阿姨,给我多加几个红极参吧。”
  “没问题!”
  夏如虹笑呵呵地答应了,一副心情不错的样子。
  吃完饭,夏如虹出门上班,夏雨菲继续作曲。
  江寒出门溜达了一圈,散心为主,顺便思考一下接下来的计划。
  半小时后,他回到了别墅中,就打开笔记本电脑,开始开发新软件。
  中文OCR都已经弄出来了,不妨稍微改进一下,再做一款性能过得去的“商用型中文手写识别”。
  这个世界上以前并没有神经网络,但这并不意味着,就没有手写识别和语音识别了。
  条条大路通罗马。
  在机器学习领域,实现同样的功能,有许多方案可以选择。
  只是这些替代方案,要么正确率不够高,要么需要强大的算力支持……
  目前为止,在商业领域还没有足够高明的手写识别算法。
  而这,正是江寒的机会。
  老实讲,再过半个月,等他那两篇关于CNN的论文传播开来……
  人工神经网络在图像识别领域的性能优势,一定会被有识之士注意到。
  到时候,几乎可以肯定,会掀起一场技术更新的盛宴。
  不出意外的话,各种各样使用了CNN的应用,会如雨后春笋般出现。
  其中绝对少不了各种手写识别软件。
  这样一来,要想在中文手写识别项目上赚到钱,就必须抓紧时间了……
  用于中文手写识别的CNN网络,和OCR神经网络相比,在架构上极其相似。
  江寒很快就把核心代码弄了出来,只在一些细节上,进行了微不足道的调整。
  然而,最大的问题是缺少训练数据。
  中文手写识别的素材库,基本上都攥在各大手机厂商,以及一些软件公司、研究所手里。
  免费使用是根本不可能的,就算肯花钱,只怕那些厂商和行业大佬,也不会很容易松口。
  江寒想了想,决定联系一下自己未来的导师。
  张德昭人在科大,说不定能联络上讯飞公司。
  手机里常见的讯飞输入法,就是讯飞公司研发的。
  江寒手机里就有讯飞输入法,他重生之后,也试用过几次。
  可惜的是,这时候的讯飞输入法,性能着实有点普通,语音输入还算可以,手写技术远远算不上成熟。
  就算这样,讯飞输入法在国内外,已经算得上顶尖水准了。
  事实上,在这个世界,大多数手写识别输入法,表现都很难让人满意。
  不难猜想,很可能是缺少了人工神经网络技术,才导致了这种情况发生……
  手写中文素材库这种东西,别的地方不好找,讯飞公司一定有。
  而且这个时候的讯飞,还不是一家股份制公司。
  这样更好,谈起交易来更加方便……
  江寒拿出手机,给张德昭拨打了过去。
  老张接起电话:“喂?”
  江寒:“张教授,我是江寒。”
  张德昭笑了起来:“是不是想好了,打算提前来上预科?”
  江寒微微一笑:“那倒不是,我这次找您,是有别的事情。”
  张德昭脾气很好:“只要不是你改主意不来了,那就有的商量。”
  江寒呵呵一笑:“您老对我有点缺少信心了,说好的事情,哪那么容易变卦?”
  老张松了口气:“那就好……什么事?说吧。”
  江寒将自己的需求描述了一遍。
  “手写汉字的素材?”
  老张思考了一下,说:“据我所知,讯飞那边的确有一个素材库,规模好像还不小。”
  顿了顿:“只是……”
  江寒笑着问:“只是怎么?”
  老张叹了口气:“我跟他们的朱总也不是很熟,空口白话的,很难让人家把那么重要的东西分享出来。”
  江寒微微一笑:“我可不是冲着占便宜去的,该掏的钱还是会掏的……”
  又说:“劳烦您从中撮合一下,不管是有偿使用,还是合作开发,我都可以考虑。”
  老张考虑了一会儿,一咬牙:“行,我就豁出这张老脸,去当一回说客!”
  江寒连忙感谢,想了想,又补充说:“当然,如果他们的条件太苛刻,那就算了,我也不想白忙活……”
  张德昭哈哈一笑:“这个你就尽管放心吧,我一定尽量把条件谈得‘合理’一点。”
  接下来,老张又询问了一下江寒的学习情况,这才是他最关心的事情。
  江寒挑不那么耸人听闻的部分,简单地汇报了一下。
  比如说,“粗略”地翻完了大学本科阶段,所有的信息学、数学,以及“少”部分物理学教材……
  虽然江寒已经尽量轻描淡写了,但听在老张的耳朵里,仍稍嫌浮夸了一点。
  “多学点数学和物理也是好事,但切记贪多嚼不烂,一定要保证学多少、会多少,在学好信息学的基础上,再兼顾其他科目……”
  对于老张的殷殷叮嘱,江寒连声称是。
  不过,回头该怎么学,还得怎么学。
  自己的路,只能自己去走。
  放下电话后,江寒继续完善程序。
  本以为这事儿,即使老张亲自出马,一时半会儿的,只怕也谈不下来。
  谁料,还没过两个小时,老张的电话就打了过来。
爱小说WWW.IXS.CC努力创造无弹窗阅读环境,大家喜欢就按 Ctrl+D 加下收藏吧,有你们的支持,让我们走得更远!
可以使用回车、←→快捷键阅读