何谨修阴恻恻地对韩念初道:“你面子还真不小。”

刘铭还是笑呵呵地说:“小心眼儿。这不还可以顺便聊聊工作嘛。”说完,他就问起了陈文韬,“语料库整理得怎么样了?”

陈文韬回道:“要剔除的语料后天应该可以整理完毕。”

韩念初听到这儿,不禁问道:“什么语料是要剔除的?”

陈文韬说:“类似一些废话,脏话,都是些没什么价值的语料。”

韩念初正在给何谨修倒茶,听到这儿,连忙放下茶壶,“你们是怎么确定那些语料是没价值的?”

蒋遥接过话,张口就是讥讽,““TMD”,“QNMD”……这些脏话留着有什么意义?还有那些蹬三轮的,搬货工人的语料,不要说语法了,他们的话有学习的价值?”

“为什么没有?机器人学习人类语言前,还要先明白人类的阶层,贫富贵贱?”韩念初反问,“脏话,是人类愤怒时的一种表达方式,也可能是某一阶层人的调侃,人工智能要不要学习识别这样的情绪?。”

“机器要学习情绪?天方夜谭!”

“机器学起来,可能比你要学得快,”韩念初反唇相讥,“如果人类够聪明,能找到提高机器学习效率的方法的话。”

“哈,至少现在不可能有。”

韩念初没说话,只把目光投向何谨修。

何谨修沉默了一会儿,说道:“整理好以后,先不要剔除。”

蒋遥意外地一怔,“可是我们都为此忙了一个多月了。”

刘铭也不解地问:“对啊,这是为什么?”

何谨修淡淡地回道:“只是先不删除而已,公司服务器缺那点空间么?”