連日來自然語言生成的認(rèn)知狀態(tài)統(tǒng)計模型向來一不斷的有小伙伴關(guān)注,不僅如此還衍生出了各大相關(guān)話題,那么跟著小編來看看自然語言生成的認(rèn)知狀態(tài)統(tǒng)計模型以及它的相關(guān)資訊吧!
為了使機器人能夠使用多種設(shè)置,它們需要能夠與人類進(jìn)行無縫通信。因此,近年來,研究人員向來在開辟越來越先進(jìn)的計算模型,該模型可以使機器人處理人類語言并制定適當(dāng)?shù)捻憫?yīng)。
機器應(yīng)掌握的人類語言的一個重要方面是在句子中使用代詞。根據(jù)一種被稱為“ Givenness Hierarchy”(GH)的語言理論,人類根據(jù)對對象在聽眾心中的“認(rèn)知狀態(tài)”的隱含假設(shè),選擇要使用的代詞。例如,如果講話者假設(shè)他們的目標(biāo)對象在當(dāng)前對話中處于“焦點對準(zhǔn)”(這是一種認(rèn)知狀態(tài)),則他們可以選擇使用代詞“它”。
科羅拉多礦業(yè)大學(xué)MIRRORLab的研究人員最近在arXiv上預(yù)先發(fā)表的一篇論文中提出了兩種認(rèn)知狀態(tài)模型。第一個模型是直接從GH文獻(xiàn)中得知的基于理論規(guī)則的有限狀態(tài)機模型,而第二個模型是預(yù)測不確定性下對象的認(rèn)知狀態(tài)的統(tǒng)計概率模型(認(rèn)知狀態(tài)過濾器)。
“我的顧問湯姆·威廉姆斯博士和他的同伴已經(jīng)開始使用認(rèn)知狀態(tài)的概念來幫助機器人自然語言理解(NLU),聽眾必須根據(jù)目標(biāo)的認(rèn)知狀態(tài)/引用形式信息來識別目標(biāo)對象”,進(jìn)行這項研究的研究人員之一Poulomi Pal告訴TechXplore。“我們最近這篇論文的主要思想/目的是基于紀(jì)律層次結(jié)構(gòu)(GH)的語言學(xué)理論為認(rèn)知狀態(tài)過濾創(chuàng)建一個計算模型,以達(dá)到自然語言生成(NLG)的目的,更具體地說,是提高機器的使用率代詞(例如,它,這個,那個等)。”
Pal和她的同事們提出的第一個模型是有限狀態(tài)機(FSM)模型,該模型根據(jù)GH文獻(xiàn)列出的規(guī)則生成物體的認(rèn)知狀態(tài)。本文介紹的第二個模型是認(rèn)知狀態(tài)過濾器(CSF),它可以從文本數(shù)據(jù)中自動學(xué)習(xí)這些規(guī)則。然后,研究人員根據(jù)通過在線Amazon Mechanical Turk平臺收集的數(shù)據(jù)訓(xùn)練和評估了他們的CSF模型。
在他們的CSF模型的實驗設(shè)計過程中,研究人員使用了OFAI多模式任務(wù)描述語料庫的銀標(biāo)準(zhǔn)英語翻譯的子集,該庫是人與人,人與機器人多模式交互作用的集合。他們發(fā)現(xiàn)CSF處理不確定性要比FSM模型更好,因為CSF不遵循預(yù)先建立的規(guī)則,而是直接從其分析的數(shù)據(jù)中獵取規(guī)則。
帕爾說:“我們的結(jié)果表明,腦脊液模型在預(yù)測物體認(rèn)知狀態(tài)方面的準(zhǔn)確性比理論上的FSM模型稍好。”“與基于規(guī)則的理論模型相比,CSF模型在嘗試評估對象的認(rèn)知狀態(tài)時(尤其是在數(shù)據(jù)較大時)可能更為可取,因為它可以自動從數(shù)據(jù)中學(xué)習(xí)規(guī)則。”
帕爾和她的同事設(shè)計的CSF模型最終可以通過改善人與機器人在對話中使用代詞的能力,最終幫助增強人與機器人之間的自然語言互動。將來,這些發(fā)現(xiàn)可能會激發(fā)其他團隊開辟類似的機器人應(yīng)用模型,以及基于其他研究領(lǐng)域的類似技術(shù),例如計算語言學(xué)或認(rèn)知心理學(xué)。
帕爾說:“我們相信,開辟像CSF這樣的計算模型將有助于促進(jìn)認(rèn)知知識的方法對自然語言的產(chǎn)生和理解的進(jìn)展。”“我的進(jìn)一步研究計劃包括開辟和實施GH信息回指生成模型,該模型考慮了在選擇NLG的不同引用形式時利用CSF模型對物體的認(rèn)知狀態(tài)。”