基于sklearn庫,搭建一個簡單的問答系統

                  日期: 2018-12-06 09:22:57 / 人氣: 3285

                  第一部分: 在這部分里,首先需要去讀取給定的文件,并把文件里的內容讀取到list里面。這部分的任務主要需要文件IO操作方面的基本知識。


                  第二部分: 處理已有的字符串數據,并把它們轉換成詞袋向量。這部分內容涉及到一些簡單的字符串預處理技術(比如過濾掉一些沒用的字符、分詞等),還有就是基于sklearn的把字符串轉換向量的過程。本部分的內容需要字符串操作、分詞、詞袋模型相關的基礎知識。

                  部分: 對于用戶的新輸入,返回答案。 這是最后一部分,也就是等我們創建完詞袋向量之后,我們就可以輸入一些新的問題,然后從庫中找出最合適的答案。這部分的任務涉及到余弦相似度、簡單搜索排序等方面基礎知識。

                  輸入問題,查看結果


                  print(answer("誰知道網上找兼職工作的網站"))

                   
                  搜索結果如下:

                  這里沒有對返回數據進行過清洗,否則體驗會更好一些…

                  --------------------- 
                  作者:簡單隨風 
                  來源:CSDN 
                  原文:blog.csdn.net/lt326030434/article/details/82909589 


                  欧美XXXX狂喷水欧美喷水