發(fā)布時間:1970-01-01 人氣:359
攜程是綜合性的OTA,它涵蓋了廣泛的業(yè)務(wù)線路,包括機票、酒店、火車票、景點門票、汽車票、租車、出租車等。攜程的系統(tǒng)也是根據(jù)業(yè)務(wù)線建立的。屬于所有業(yè)務(wù)線的人只能為客人提供業(yè)務(wù)線咨詢。然而,一次旅行往往涉及到全面的資源調(diào)度。攜程還致力于為用戶提供一站式的服務(wù)體驗。顯然,用戶需要找到相應(yīng)的業(yè)務(wù)線來咨詢旅行中的問題。圖1顯示了用戶在咨詢時需要找到相關(guān)業(yè)務(wù)線的場景。
隨著我們團隊在各業(yè)務(wù)線咨詢中引入機器人輔助勞動力,成熟度越來越高,我們有進一步的計劃,即攜程App一站式機器人的推出可以讓用戶解決一次旅行可能涉及的各個方面。
本文將首先比較當前用戶咨詢問題入口與一站式入口的異同,從而導(dǎo)致建立一站式機器人的重要性和挑戰(zhàn),然后結(jié)合具體情況講述機器人的完整結(jié)構(gòu),并詳細介紹自然語言理解部分(NLU)的算法。
機票訂單詳情頁入口的機器人,只能回答本業(yè)務(wù)線的問題,對于跨業(yè)務(wù)線的問題只能提供轉(zhuǎn)接服務(wù);一站式入口的機器人,擁有解答全業(yè)務(wù)線問題的能力。
讓我們來看看酒店咨詢和推薦混合需求的例子。在圖3中,用戶瀏覽酒店后,咨詢酒店是否有游泳池。在得知酒店沒有游泳池后,他們希望在附近的地區(qū)找到一家有游泳池的酒店。圖3的左半部分是用戶通過酒店詳細信息頁面進入咨詢?nèi)肟诤蟮姆?wù)流程。由于入口限制了所有的咨詢只能針對特定的酒店,因此用戶的推薦需求只能選擇手動轉(zhuǎn)移。圖3的右半部分是用戶在一站式入口處獲得的服務(wù)流程。一站式具有咨詢和推薦的能力。
圖3 酒店詳情頁入口及一站式入口酒店詳細信息頁面入口處的機器人僅限于特定酒店,只能提供與酒店相關(guān)的信息問答;一站式入口可靈活提供酒店信息、酒店預(yù)訂和推薦功能。
綜上所述,我們可以看到的咨詢?nèi)肟谙啾龋徽臼接袃蓚€明顯的優(yōu)勢。
首先,一站式擁有全業(yè)務(wù)線的知識,可以在不進入各業(yè)務(wù)線的情況下,為用戶提供全方位的旅行支持。
第二,一站式除了咨詢技能外,還有更多的技能,如推薦、預(yù)訂等,為用戶帶來更方便的一站式體驗,也為企業(yè)創(chuàng)造了準確營銷的可能性。
二、“一站式”機器人架構(gòu)在部分,我們可以看到一站式機器人比目前的系統(tǒng)有很大的優(yōu)勢,但也有很大的挑戰(zhàn)。
當用戶進入一站式入口時,與每條業(yè)務(wù)線的咨詢?nèi)肟诓煌覀冃枰ㄟ^自然語言理解算法了解用戶的服務(wù)需求。此外,一站式入口的許多技能也需要在適當?shù)臅r間激活,因此我們需要一個對話管理模塊來控制這些技能的激活,對話管理模塊也將與自然語言理解模塊一起使用,以更準確地分析用戶的真實需求。
圖4是算法端一站式機器人的完整架構(gòu),在架構(gòu)中省略了服務(wù)端的接口調(diào)用和前端的顯示邏輯。自然語言理解模塊主要包括三個子模塊、領(lǐng)域分類、意圖分類和槽分析,該模塊的結(jié)果輸出到對話管理模塊。對話管理模塊更新了當前的對話狀態(tài),并根據(jù)分析的用戶意圖選擇了合適的機器回復(fù)。最終的回復(fù)生成模塊負責(zé)調(diào)用各種問答、推薦和技能服務(wù),并使用自然語言用戶的需求。
圖4在對一站式機器人的結(jié)構(gòu)有了初步的了解之后,我們將回顧部分的兩個例子。
在圖5中,用戶進入入入口并發(fā)起咨詢,我取消了機票訂單,但沒有收到退款。自然語言理解模塊分析了機票領(lǐng)域,意圖是機票領(lǐng)域的問答。對話管理模塊選擇相應(yīng)的機票問答Action,調(diào)用機票業(yè)務(wù)線服務(wù)常見問題(FAQ)回答用戶的問題。滿足用戶需求后,進一步咨詢酒店退款。自然語言理解模塊識別用戶在酒店領(lǐng)域的問答意圖,對話管理模塊選擇相應(yīng)的酒店問答Action,調(diào)用酒店業(yè)務(wù)線業(yè)務(wù)常見問題服務(wù)(FAQ),滿足用戶完整的服務(wù)需求,實現(xiàn)一站式目標。
圖5 一站式機器人完成跨業(yè)務(wù)線用戶的服務(wù)需求讓我們看看圖6中的另一個例子。在酒店預(yù)訂過程中,用戶咨詢酒店是否有游泳池。自然語言理解模塊分析了用戶的意圖是酒店領(lǐng)域的問答,并分析了酒店和酒店設(shè)施的槽。對話管理模塊填寫酒店和酒店設(shè)施的槽,并要求酒店KBQA服務(wù),了解酒店沒有游泳池。用戶進一步詢問附近是否有其他酒店有游泳池。自然語言理解模塊分析用戶意圖是酒店領(lǐng)域的推薦,并分析酒店設(shè)施的槽位。對話管理模塊更新酒店設(shè)施的槽位,將中心地標和酒店設(shè)施帶入接口,查詢符合相應(yīng)條件的酒店。
圖6 一站式機器人法在部分,我們描述了建立一站式機器人的動機,并比較了它與當前業(yè)務(wù)線咨詢?nèi)肟诘漠愅T诘诙糠郑覀兘o出了一站式機器人的算法架構(gòu),并結(jié)合兩個例子描述了它的工作過程。從機器人架構(gòu)的角度來看,自然語言理解是步,也是一個非常重要的模塊。只有正確地理解用戶Query機器人可以通過對話管理和自身技能為用戶服務(wù)。
用戶自然語言理解模塊Query的解析主要包括兩個部分,意圖識別和槽位解析,其中意圖識別又被細分為領(lǐng)域分類和領(lǐng)域下的意圖分類,主要使用分類算法,槽位解析主要使用實體識別和實體鏈接的一些算法。在此我們著重介紹意圖識別中使用到的分類算法。
考慮到我們場景中的領(lǐng)域與意圖之間存在層次關(guān)系,即每個意圖都是某一領(lǐng)域下的一種意圖,我們在設(shè)計算法時充分反映了這種層次關(guān)系。如圖7所示,我們使用表將用戶輸入轉(zhuǎn)換為one-hot形式,通過Embedding層轉(zhuǎn)換為連續(xù)向量,用戶的輸入可以是字級或字級,也可以通過字級結(jié)果CNN或Highway Network方式和詞級Embedding結(jié)合。
然后我們用LSTM或GRU的RNN類序列表征層學(xué)習(xí)序列的表征。通過全連接層和soft ** x激活函數(shù),獲得該領(lǐng)域的預(yù)測結(jié)果。一方面,該領(lǐng)域的預(yù)測結(jié)果將以真實的領(lǐng)域標簽作為損失函數(shù)的一部分,也將與隨機初始化的領(lǐng)域相結(jié)合Embedding矩陣點乘得到與句子相關(guān)的領(lǐng)域向量。該領(lǐng)域的向量與以前的序列表征共同構(gòu)成意圖分類的輸入,我們使用另一個LSTM或GRU的RNN序列表征層進一步表達序列,再次引入領(lǐng)域向量對序列結(jié)果進行Attention操作得到最終句子表征。通過全連接層和soft ** x激活函數(shù),得到預(yù)測結(jié)果。
圖7 領(lǐng)域及意圖分類算法在我們的實驗過程中,Embedding層的各種方法差別不明顯,我們嘗試包括詞級的方法Embedding、字級別Embedding以及字級CNN結(jié)合詞級共同行動Embedding;序列表征層的各種方法差異不明顯,包括GRU、LSTM以及Self-Attention層。當獲得最終表征層時,基于領(lǐng)域向量Attention操作相比于CNN特征提取方法及對RNN輸出的隱向量做 ** x-pooling方法顯著提高,分類精度提高約1.5%-2%。與平鋪意圖分類方法相比,級聯(lián)意圖分類方法有了顯著提高,分類精度提高了2%左右-3%。我們認為這種方法之所以能帶來改進,是因為它首先預(yù)測了相對簡單的領(lǐng)域標簽,然后使用該領(lǐng)域的信息來輔助預(yù)測意圖,類似于curriculum learning從易到難的過程可以使模型更好地學(xué)習(xí)。
我們在離線數(shù)據(jù)集的培訓(xùn)集上培訓(xùn)模型,在開發(fā)集上調(diào)整參數(shù),在集上評估調(diào)整參數(shù)優(yōu)化后的模型。集的領(lǐng)域級別分類精度約為90%,意向級別分類精度約為87%,模型符合在線可用標準。
四、結(jié)語在本文中,我們向讀者描述了攜程的一站式機器人愿景,并提出了其優(yōu)勢和挑戰(zhàn)。我們采用了結(jié)合自然語言理解和對話管理的算法架構(gòu),使一站式機器人著陸。
未來,我們將繼續(xù)從多個角度進行優(yōu)化,包括更精細的自然語言理解、更準確的意圖分類和槽分析模型、容錯對話管理過程、更豐富的知識庫、更好的意圖擴展等,希望創(chuàng)建智能一站式機器人,與各業(yè)務(wù)線人員更好地服務(wù)攜程用戶。
【作者簡介】經(jīng)緯,從事機器人算法研發(fā),專注于nlp該領(lǐng)域的算法研究和應(yīng)用,如數(shù)據(jù)和場景驅(qū)動的算法研發(fā)。
更多攜程技術(shù)人員干貨文章,請關(guān)注攜程技術(shù)微信公眾號。
本文鏈接:http://www.xq001.cn/hangyeyedongtai/4090.html
熱線電話
18594279421
上班時間
周一到周五
公司電話
18594279421