日前,由搜狗搜索聯(lián)合中國中文信息學會(CIPS)共同舉辦的“CIPS-SOGOU問答比賽”正式啟動報名。作為國內首檔基于大規(guī)模真實用戶問答數(shù)據(jù)集的問答評測任務,此次大賽的舉辦,不僅能為參賽者提供挑戰(zhàn)及展示能力的舞臺,還將促進學術界及業(yè)界在智能問答領域的研究發(fā)展,推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務。
此次問答比賽分為事實型問答和非事實型問答兩項子任務。按照賽制,參賽者需要根據(jù)給定的問題設計算法,從候選篇章中抽取合適的詞語、短語或句子,作為問題的標準答案,能夠實現(xiàn)正確、完整、簡潔地回答問題。每個問題對應給出10個候選答案篇章,每個篇章約50 - 500個漢字。
在評測指標方面,事實型問答子任務將采用Accuracy和Precision-Recall(F1)指標對預測答案進行評價,其中Accuracy計算預測答案和標準答案是否精確匹配,F(xiàn)1計算預測答案相對標準答案的詞級重合度,以兩者平均值作為最終指標。非事實型問答子任務采用ROUGE和BLEU指標對預測答案進行綜合評價。
據(jù)悉,此次比賽的事實型問答子任務,將從9月1日起開始提交報名,有興趣參賽的高校生、業(yè)內研究人員等,可通過“搜狗實驗室”官網(wǎng)提交報名信息。非事實型問答子任務,則將在12月中旬開始接受提交報名,并陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學術年會上,將會對兩項子任務中勝出的團隊進行頒獎。
值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來自搜索引擎的大規(guī)模真實用戶問答數(shù)據(jù)集。其中,6萬個問題(事實型問題3萬、非事實型問題3萬),代表了最真實廣泛的網(wǎng)民信息需求;60萬對應問題的候選篇章,來自搜索引擎返回的若干互聯(lián)網(wǎng)頁面;而經(jīng)過對頁面進行人工分析標注,搜狗搜索構建了針對問題的標準答案,最終形成大規(guī)模、極具價值的問答數(shù)據(jù)集。
據(jù)了解,目前在智能問答研究領域,可用的大規(guī)模公開數(shù)據(jù)集,尤其是反映真實用戶問答需求的中文數(shù)據(jù)集非常稀缺。業(yè)界和學術界受限于技術、數(shù)據(jù)等因素,當前的研究主要針對“事實型問答”領域,而在與用戶搜索場景息息相關的“開放域智能問答”領域則一直無法取得突破性進展。搜狗搜索此次公開的大規(guī)模數(shù)據(jù)集,不僅能促進“CIPS-SOGOU問答比賽”的正常開展,還能將給整個智能問答行業(yè)的研究發(fā)展提供寶貴的數(shù)據(jù)支撐,從而推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務。
事實上,憑借在人工智能領域的持續(xù)投入及搜索引擎的數(shù)據(jù)優(yōu)勢,搜狗搜索目前在智能問答領域已處于行業(yè)領先地位。搜狗搜索此前已上線的“立知”智能問答系統(tǒng),就是搜狗研發(fā)的面向未來的搜索技術。該系統(tǒng)能夠理解用戶搜索意圖和問題,直接為用戶提供想要的答案。目前“立知”智能問答系統(tǒng)不僅能精準回答事實性問題,在分析類問題、觀點類問題、數(shù)字類問題、隱式問題等方面,都能直接返回精確答案,背后應用了語義分析、問題理解、信息抽取、知識圖譜、信息檢索、深度學習等眾多人工智能技術。
作為智能問答領域的引領者,搜狗搜索在切實推進產品落地、為用戶帶來優(yōu)質搜索體驗的同時,也注重向行業(yè)開放問答能力,不斷推動業(yè)界及學術界的研究發(fā)展。今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國信息檢索學術會議)成功舉辦了國內首次大規(guī)模真實用戶問答數(shù)據(jù)集上的問答評測任務——首屆“面向智能問答的篇章排序”評測比賽,并公開了來自用戶真實搜索需求的5萬個問題以及從搜狗搜索全網(wǎng)檢索結果提供的50萬條候選篇章,極大促進了智能問答技術的發(fā)展和應用。
相比“面向智能問答的篇章排序”評測比賽,此次“CIPS-SOGOU問答比賽”的賽制、公開數(shù)據(jù)集等都將進行全新升級,將會在更大程度上促進智能問答領域的學術交流和研究水平。對此次問答評測比賽感興趣的高校生或業(yè)內從業(yè)者,均可報名參加。
- 魏建軍五一假期試駕全新高山:第三排也能當老板位,上市倒計時!
- 英偉達RTX PRO 6000顯卡現(xiàn)身Geekbench,顛覆性能震撼來襲,CUDA核心爆表,ECC顯存領先業(yè)界
- 工信部發(fā)力工業(yè)領域數(shù)據(jù)集建設,打造通用大模型與行業(yè)大模型新篇章
- 特斯拉:顛覆傳統(tǒng)視覺處理方案,打造人人都能擁有的智能駕駛未來
- 新能源車市場崛起:中國占全球份額超六成,增量貢獻度達八成
- 蘋果CEO庫克致敬巴菲特:一生之幸,得與股神共事
- 微軟必應逆襲成功,市場份額升至12.2%,谷歌地位受挑戰(zhàn)降至79.1%。
- 股神巴菲特宣布年底告別江湖,接班人揭秘:神秘投資者露面
- 抖音回應于東來“退圈”事件:下架侵權視頻,維護版權新風向
- 蘋果因關稅政策額外增加9億美元成本,庫克回應:挑戰(zhàn)升級
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。