一三中文网

手机浏览器扫描二维码访问

第十八章 语义识别的难点(第3页)

“联网就联网吧,在程序里预留一些常用算法,断网勉强也能用。”

解决了第一个问题之后,罗辑又陷入了瓶颈。

他蓦然想起中文还有一点很蛋疼,那就是没有和英文一样可用于区分人名地名的大小写。

要是仅仅这样也就罢了,关键是有些人的名字起就是一个词语,如果分词程序有智能的话,它一定会把这些人拖出去砍死。

比如高峰、汪洋、罗辑……

“这……还是不要砍死了,半残就好。”

罗辑马上停止了抱怨了,再困难也要解决不是?

“到底要怎么做?”

罗辑觉得自己有些天真了,一开始以为有了科技树绝对可以快速的解决问题,可事实上并非如此。

之前做无线充电器时,都要用到机械方面的知识,而难度比无线充电更大的语义识别,其交叉的学科只会更多。

“语义识别要什么?电脑编程、统计分析、数据建模……还有语言学?”

罗辑看到科技树上显示的内容完全傻眼了,前面的只要的理科内容,不管多难他都不怕,可偏偏最后一项他却没有办法。

让罗辑去看文科知识,那比杀了他还难受。

可不学语言学,怎么可能做的出语气识别?

罗辑抓破脑袋也没有想出代替方案,这似乎是唯一的解决方法。

想想也是,对语言不熟悉的人又怎么做的出语义识别?作为社交白痴的罗辑,自己都听不太明白别人的话,又怎么让电脑也“听”

的懂?

学习语言学?

罗辑硬着头皮只看了一会,就感觉头大如斗,就像熬了好几个通宵,困意如潮水般一*涌来,怎么也挡不住。

这道是个催眠的好方法,罗辑有些哭笑不得。

“只能走一步看一步了。”

罗辑决定先将这个问题搁置,等其他能解决的都解决了,再回头来考虑这个问题。

先搭建模型吧。

语义解析得到步骤和前两步很想,都需要一定量的数据支持。

好在有小音的帮助,不需要罗辑去亲自搭建语料库,不然光是这一个工程就能让开发时间延长几倍。

繁琐的数据积累永远是最费时间的,不过幸好小音的智能程度提高了,她能替罗辑执行的工作也越来越多,可以说只要语义识别完成,她就和电影里的那些黑科技差不多了。

研发的过程对于别人也许是枯燥的,但对罗辑来说却是让人兴奋不已的。

因为在拥有了科技树之后,他基本不会做无用功,任何研究都有一个明确的方向,所以他的研究每时每刻都在向目标推进。

七天后,罗辑在属于自己的机房里长出了口气。

现在上他能解决问题都解决了,自动分词系统也趋于实用,至少不会出现乌龙了。

一些带有歧义的句子也能分析出来。

比如“独立自主和平等互利的原则”

本月排行榜
本周收藏榜
热门小说推荐
一顾齐眉

一顾齐眉

法学院大三学生林泉一,因缘巧合结识了刚从监狱出来的顾灵秀,并同住一屋檐下。她以为他是杀人之犯,却依旧一顾倾心。他以为她是汪泽凯使的美人计,终是一步步沦陷。...

征服美女董事长

征服美女董事长

南下打拼的穷屌丝做梦也想不到,网聊许久的女网友,竟然是现实中高不可攀的董事长...

情深不言

情深不言

沈念欢唔,陆湛北,你干嘛?陆湛北干!沈念欢腹黑毒舌的禁欲男神忽然变身饿中色魔。从此,沈念欢的生活只剩一日,三餐。...

足球大师

足球大师

恭喜王帅同时荣膺今年的国际足联金球奖和最佳教练奖!王帅表示不屑一顾,哥的征途是星辰大海!...

诡墓迷灯

诡墓迷灯

三个月前,九叔找到我,带我进入一个诡异而又神奇的地方,自此之后,诡异不断降临,恐怖紧随我身,我想走,我想离开,但为时已晚。我放得下一切,却放不下你!逃得了一切,却逃不开命运!原来一切,早已注定!书友群,欢迎各位进来聊剧情427804892...

唐朝大宗师

唐朝大宗师

简介相传有一个二十一世纪的大学生秦轩曾穿越唐朝,并成为一代大宗师!据说对联的产生诗歌的兴起雕版印刷的昌盛活字印刷术的发明酒之蒸馏杏花村的闻名唐三藏西游佛教盛行唐太宗的改革武则天还政李家狄仁杰闻名资本主义萌芽等等,都与他不无关联。然而史书却没有记载,却是为何?就在国人不断歌颂唐朝鼎盛的多年以后,二十三世纪考古学家于终南山一处古墓发现了端倪,墓中竟然发现了二十一世纪盛行的手机内存卡,经过众科学家的修复,从其中发现了一篇自传。本书不过是根据那篇电子档的自传,向世人诉说一段不为人知的故事...

每日热搜小说推荐