構(gòu)建開放域智能問答系統(tǒng)是人工智能研究領(lǐng)域的一項重要前沿課題。近日,由搜狗搜索聯(lián)合中國中文信息學會共同舉辦的“CIPS-SOGOU問答比賽”,正式啟動了“非事實類問答子任務”。搜狗搜索將公開百萬級真實用戶問答數(shù)據(jù)集,為參賽者提供一展身手的舞臺,從而促進學術(shù)界及業(yè)界交流,提升智能問答領(lǐng)域的研究水平,推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務。
“CIPS-SOGOU問答比賽”,是國內(nèi)首檔基于大規(guī)模真實用戶問答數(shù)據(jù)集的問答評測任務。大賽根據(jù)問題類型將比賽任務分為“事實類問答子任務”和“非事實類問答子任務”,分別對應事實類問題和非事實類問題。去年9月,該大賽伴隨著“事實類問答子任務”的啟動已正式開賽。
而于近日啟動的“非事實類問答子任務”,無疑又為大賽注入新機,將賽事推向高潮。相較于“事實類問題”,“非事實類問題”包括更廣泛的問答內(nèi)容形式,包括列舉(list)、定義(definition)、方式(how)、原因(why)、假設(hypothetical)等等。
根據(jù)賽制,基于搜狗搜索提供的問題,以及相對應的若干候選答案篇章,參賽者需設計算法從候選篇章中抽取合適的詞語、短語或句子,形成一段正確、完整、簡潔的文本,作為預測答案,以正確、完整、簡潔地回答該問題,答案文本長度限定在500字內(nèi)。
針對大賽中的每個問題,參賽者只需提供一個預測答案。“非事實類問答子任務”將針對該預測答案與標準答案計算ROUGE-L和BLEU值,再以測試集上兩個指標的平均值作為最終指標。此次比賽將在2018年11月CIPS年會上舉行頒獎儀式,授予獲勝者獎金和榮譽證書。
(圖:CIPS-SOGOU問答比賽任務說明)
值得期待的是,此次“非事實類問答子任務”中,搜狗搜索將公開百萬級真實用戶問答數(shù)據(jù)集。包含10萬個非事實型問題,代表了最真實廣泛的網(wǎng)民信息需求;以及100萬個對應問題的候選篇章及答案標注(每個問題對應給出10個候選答案篇章),候選篇章都是從搜索引擎檢索真實網(wǎng)頁結(jié)果中抽取的文本。
實際上,搜狗搜索在此次任務中提供百萬級真實用戶數(shù)據(jù)集,除了促使大賽正常開展外,更有意義的是,此舉為構(gòu)建開放域智能問答系統(tǒng)的研究提供了剛需的數(shù)據(jù)支撐,有助于促進智能問答領(lǐng)域技術(shù)的發(fā)展和應用,從而推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務,讓用戶更加便捷地獲取信息和知識。
作為國內(nèi)第二大搜索引擎,搜狗搜索憑借自身數(shù)據(jù)優(yōu)勢及在人工智能領(lǐng)域研究的持續(xù)大力投入,已經(jīng)在智能問答領(lǐng)域處于領(lǐng)先地位,率先實現(xiàn)了“直接為用戶提供答案”。搜狗搜索已上線的“立知”智能問答系統(tǒng),就是其研發(fā)的面向未來的搜索。該系統(tǒng)能夠理解用戶搜索意圖,并直接提供答案。目前,“立知”智能問答系統(tǒng)在事實性問題、分析類問題、觀點類問題、數(shù)字類問題、隱式問題等方面,都能為用戶直接返回精確答案。
現(xiàn)在,作為智能問答領(lǐng)域的帶路黨,搜狗搜索開放技術(shù)能力,向?qū)W界及業(yè)界提供百萬級真實用戶問答數(shù)據(jù)集,助力行業(yè)向“非事實性問答”領(lǐng)域研究開拓,促進智能問答領(lǐng)域的學術(shù)交流。有興趣進行技術(shù)切磋,提升研究水平的高校師生及業(yè)內(nèi)研究人員,均可通過“搜狗實驗室”官網(wǎng)提交報名信息參賽。
- 京東外賣又爆頻繁超時!客服回應:高峰期騎手接單有延遲
- 聯(lián)想發(fā)布多款智能新物種,端側(cè)AI引領(lǐng)未來,輕觸現(xiàn)實生活革新
- 黃仁勛開場白中多次提及華為:別樣的話題,不回避的態(tài)度
- 黃仁勛警告:不善用AI者將面臨失業(yè)危機,未來競爭看誰更懂AI
- 馬斯克AI超算項目被指污染空氣:每年排放大量有害氣體,環(huán)保問題引關(guān)注
- 蘋果突破創(chuàng)新!iPhone 18 Pro首次支持可變光圈,華為領(lǐng)先一步?
- 五一假期蔚來換電單量創(chuàng)新高!真實用戶反饋揭秘
- 新勢力造車年度KPI大比拼:小鵬領(lǐng)先,蔚來理想緊隨其后
- 極氪高管調(diào)整:壓力之下求變,銷量承壓如何破?
- 印度“芯夢碎”:兩大半導體項目折戟,造芯雄心成空談
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。