發(fā)布時間:2022-2-4 分類: 行業(yè)動態(tài)
任何產(chǎn)品的出現(xiàn)都源于用戶需求。無論是現(xiàn)有的庫存需求還是正在擴(kuò)大規(guī)模的增量需求,對話機(jī)器人也不例外。當(dāng)我們談?wù)摗罢務(wù)摍C(jī)器人”產(chǎn)品時,我們?nèi)绾慰创浔澈蟮男枨螅?/p>
如今,具有對話能力的機(jī)器人越來越被認(rèn)為是核心智能。他們是否能夠流利地完成對話可以被視為機(jī)器人真正擁有智慧的唯一證據(jù)。
從可追溯的歷史數(shù)據(jù)來看,聊天機(jī)器人自20世紀(jì)60年代就已存在。經(jīng)過近五六十年的發(fā)展,今天我們可以看到許多產(chǎn)品中對話機(jī)器人的影子。微軟的Cortana,小冰,Apple的Siri,Google Now,阿里小米,百度秘密,圖靈機(jī)器人,助理,并出去問問。
可以肯定的是,對話機(jī)器人已經(jīng)成為一種行業(yè)時尚,越來越多的公司正試圖通過這種新的互動形式來優(yōu)化或升級他們的產(chǎn)品 - —我們已經(jīng)可以看到許多產(chǎn)品。各種子產(chǎn)品稱為“X-X機(jī)器人”。
有這么多對話機(jī)器人,很容易讓人感覺到開花和上升。我們可能模糊地認(rèn)為每個對話機(jī)器人產(chǎn)品都是相似的,有些產(chǎn)品有一些不同的特點,但畢竟給人一種不屬于過去十年移動互聯(lián)網(wǎng)發(fā)展的感覺 - —這些對話機(jī)器人看來它們還很早,用戶量似乎不大,似乎有點小眾。
我將嘗試分析純產(chǎn)品的視角:產(chǎn)品對話機(jī)器人的背后,需求和產(chǎn)品邏輯是什么(我不打算在文章中比較每個對話機(jī)器人的優(yōu)缺點,也不討論產(chǎn)品視圖對話機(jī)器人或方法論)。
首先,探討“對話”和“對話”行為背后的需求
首先,我們嘗試探索“對話”場景及其背后的需求。
在《人類簡史》中,人們認(rèn)為語言能力是智人將其與其他蝎子區(qū)別開來的最重要特征和能力;由于語言能力的提高,智人可以通過對話形成更豐富的互動,從而具有協(xié)作和后來的文明。
人類有三種最直接的方式來使用這種語言:“一對零”,“一對多”,“一對一”。
“一對一”是自我內(nèi)化的反思,總結(jié)和沉淀,不會互動和分享。
“一對多”是廣播式講道和相對單向輸出,例如一般會議或命令。
“一對一”是對話——群聊也是由許多“一對一”組成的,所以我認(rèn)為沒有真正的“多對多”對話。我認(rèn)為對話是我們與外界互動的最直接,最直接的方式(注意“立即”很重要)。
所謂的對話必須是相互作用和I/O(輸入/輸出)的過程。例如,兩個人說話,每個人說的是為自己輸出并為另一方輸入。原則上,對話可以永遠(yuǎn)持續(xù)下去。
但我們幾乎從未見過兩個人永遠(yuǎn)在說話。那是因為如果雙方都需要繼續(xù)對話,雙方都需要保持參與;如果任何一方感到疲倦或毫無價值,對話將結(jié)束。
對話的場景更接近我們的生活行為,它是最頻繁的,環(huán)境是開放的和多樣的,分析它背后的需求并不容易?,F(xiàn)在我們需要回答兩個問題:
1.1第一個問題:為什么會話開始?
我認(rèn)為人們的對話有三個層次的需求。
第一層是基本問題和答案的需要??梢悦枋鰹椋?/p>
我有一個問題,請回答我。
二次提問的問題是一個新問題。此過程與我們今天使用的搜索引擎非常相似。
第二層是任務(wù)流程協(xié)作需要達(dá)到某種目的。可以說是:我想請你幫我買明天下午14點: 00-18: 00,北京到上海;經(jīng)濟(jì)艙,盡可能便宜,最好是東方航空。我們和朋友一起去購物,請同事們幫忙預(yù)訂會議室,并接受了女朋友要求提前叫醒她的請求。
這些都是任務(wù)流程協(xié)作的所有要求。
第三層是創(chuàng)造共同的情感,無論多么快樂或悲傷。聊天的目標(biāo)很難量化。我們更傾向于定性地設(shè)定聊天的目標(biāo)。這可能是你需要一個好人心情不好,或者你可能需要與好朋友分享。我們需要對話來表達(dá)最直接和最直接的表達(dá)。
我不認(rèn)為只有孤獨的情感需要對話 - —作為一群有發(fā)展史的動物,與他人分享情感是一種已經(jīng)被刻入基因的特征。只是我們建立的情感在不同的人之間會有所不同。那些信任的人的情感建設(shè)將會非常深刻,并且會有很多人為此點頭。
開啟對話必須源于上述要求之一,而開放的機(jī)會是一個相對明確的話題,即使它只是一個短語“我很餓”。
1.2第二個問題:為什么對話繼續(xù)?
對話可以持續(xù)兩個原因。
第一個原因是至少有一方的需求尚未得到滿足。例如,如果我提問,對方就不會滿意我,我會繼續(xù)提問。兩個女孩一起談?wù)摪素?,聽的人非常著迷,說話的才能有成就感,可以繼續(xù)說話。
第二個原因是雙方相對平等。如果我問一個問題,或者請對方幫助我,但對方總是高調(diào)而不理我,那么我會輕易放棄而不想說話。相反,如果對方過分尊重我,我總是說沒有營養(yǎng)恭維。很長一段時間后,我會變得更加虛榮,感到無聊。因此,人們不會與階級或品味太差異的人聊天,大多數(shù)人不會長時間與寵物聊天。
終止對話的最根本原因是雙方都放棄了這一輪對話。
描述終止對話的原因的感性,可以說雙方都覺得“累”,就是這一輪對話的能耗已經(jīng)用盡;即使這對夫婦說出甜言蜜語,談?wù)搩扇Ь湓捨乙矔械絽捑耄谑畮纵喰越弧巴戆病敝薪Y(jié)束這次談話。
因此,對話將始終結(jié)束,能源消耗將終止。
二,“對話機(jī)器人”業(yè)務(wù)從搜索引擎發(fā)展
在我之前的文章《進(jìn)階之路:站在高視角看產(chǎn)品是一種怎樣的體驗》中,我談到了一個名為“知識詛咒”的概念。簡單地說:我現(xiàn)在理解一件事,但很難完全清楚地教導(dǎo)你;因為我們有不同的知識背景,我們對同一事物有不同的理解。這就解釋了為什么許多教師在課堂上無趣,許多人在做演講時顯得蒼白無力。這實際上是工作中的知識詛咒。
知識詛咒的一個大問題是,每當(dāng)我們接觸到一個不熟悉的東西時,我們就會將它與我們自己的背景知識進(jìn)行比較。例如,對于長發(fā)飄飄的美女,據(jù)我所知,這種美女一般都是一個好家庭,溫柔,善良的導(dǎo)師。因此,當(dāng)我再次看到類似的美時,我會做類似的第一印象類比。
不僅僅是美麗,我們幾乎所有的知識都源于過去的背景知識。
在人類發(fā)展的歷史中,幾乎總是存在對即時問題和答案的需求。最早,我們問部落中最年長的智者。后來,每個人都有一個知識儲備,他們可以通過對話進(jìn)行基本的問題和答案以及對話。 —這個過程持續(xù)了數(shù)千年。同樣的問題,最早只能問一個人并得到答案;以后,你可以問很多人,得到很多答案,然后“l(fā)dquo;從中選擇好人。如果我可以一直問每個人,我可能會得到大量答案;我需要過濾,排序和選擇。您發(fā)現(xiàn)此過程是“搜索引擎”。當(dāng)我們使用搜索引擎時,我們通過“輸入框”輸入我們想要詢問的問題或關(guān)鍵字,搜索引擎將向我提供已排序和優(yōu)化的答案集合。
但我認(rèn)為有兩個原因會導(dǎo)致搜索引擎逐漸演變?yōu)閷υ挋C(jī)器人。
2.1一:對精確答案的需求越來越強(qiáng)烈
搜索引擎已經(jīng)從簡單的信息集合中逐漸呈現(xiàn)出精確的答案,這些答案已經(jīng)持續(xù)了好幾年。 “百度阿拉丁”是典型的。例如,當(dāng)您詢問“北京天氣”時,百度搜索結(jié)果頁面上的第一項是精心設(shè)計的天氣卡,通過豐富的用戶界面顯示天氣相關(guān)信息。阿拉丁可以涵蓋大多數(shù)熱門搜索術(shù)語,但是對于腰部需求和長尾需求,隨著信息的爆炸,人們對搜索多個頁面的容忍度會越來越低,“快速”和“快速”。 &quoquo;準(zhǔn)“rdquo;需求只會越來越大。
2.2第二:搜索場景中的輸入能耗過大
從能耗體驗的角度來看,搜索的輸入框遠(yuǎn)遠(yuǎn)高于聊天聊天的輸入框。即使連續(xù)輸入相同的主題,聊天聊天的疲勞也會明顯低于搜索。
如果每天提問的平均人數(shù)是N,那么幾年內(nèi)它會迅速達(dá)到10N。用戶很難在沒有升級的情況下滿足體驗?;貧w對話的方式是良好的體驗優(yōu)化,可以抵消需求的增長。
三,“對話機(jī)器人””產(chǎn)品場景:封閉域?qū)υ扸S開放域?qū)υ?/p>
優(yōu)秀的產(chǎn)品經(jīng)理知道如何在使用產(chǎn)品時控制用戶的各種操作,從而提前控制用戶的期望,從而實現(xiàn)相對最佳的體驗。
許多優(yōu)秀應(yīng)用程序的基本設(shè)計邏輯是頁面之間的跳轉(zhuǎn)是規(guī)則有序的,因此用戶不會通過單擊跳出預(yù)設(shè)過程,并且期望是相對可控的。在手機(jī)上的App產(chǎn)品交互中,您可以通過各種邏輯和提示信息控制期望——但對話機(jī)器人如何控制期望呢?
由于對話機(jī)器人用戶幾乎都通過自然語言輸入進(jìn)行交互,并且一次只有一個句子;用戶的預(yù)期控制只能通過用戶的輸入和對輸入的響應(yīng)來實現(xiàn)。
然而,在對話和聊天的場景中,用戶的輸入有時是可控的和不可控制的;我們不能像App設(shè)計那樣創(chuàng)建一個封閉的邏輯閉環(huán)讓用戶遵守規(guī)則——對話聊天是一個自然的開放場景,用戶通常如何與朋友交談,以及機(jī)器人將如何交談。
因此,我們?nèi)藶榈貙υ挿譃閮煞N情景:
Closed Domain對話框:要求用戶輸入特定的話語以繼續(xù)對話
開放域名對話:如果用戶說出他們的言論,用戶可以繼續(xù)說話。
3.1封閉域?qū)υ?/p>
封閉域名對話有兩個關(guān)鍵特征:
輸入和輸出可以分類和枚舉
對話有一個明確的開始和結(jié)束,并且有一個過程
因此,在對話的三個要求中,問答和任務(wù)流程協(xié)作都屬于封閉域?qū)υ挕?
封閉域?qū)υ挼脑O(shè)計邏輯繼續(xù)從“IFTTT(如果這樣那么)”繼續(xù),這是工作流的演化形式。感興趣的學(xué)生可以到App Store搜索名為“Workflow”的應(yīng)用程序,這沒關(guān)系。一系列最初不相關(guān)的App通過條件判斷連接)。
讓我分享兩個封閉域聊天的典型案例。
閱讀機(jī)器人
十年前,微軟Bing推出了一款“閱讀機(jī)器人”,可以在20個問題和答案中猜出你的想法。幾年前,這個機(jī)器人曾經(jīng)有過對話問答版本。用戶只需要在每一步都回答“是”或“無”,并且會話將繼續(xù),直到猜測或結(jié)果無法猜到。
Bing閱讀機(jī)器人
這是典型的閉域多鏡頭問答環(huán)節(jié)。用戶只有兩個輸入,這個過程是一系列邏輯判斷,具有相對固定的過程,清晰的開始和結(jié)束。
亞馬遜回聲演講者
亞馬遜的Echo揚聲器對每個人都很熟悉。 Echo成為爆炸性產(chǎn)品的關(guān)鍵原因之一是其對話機(jī)器人Alexa是Echo揚聲器場景設(shè)計中的封閉域?qū)υ?。由于揚聲器是我們家庭場景中最常見的高頻互動指揮官,除遙控器外,很難在家中找到這樣的硬件。除了輕松輸入命令外,它還可以快速,清晰地反饋。
當(dāng)我們輸入指揮官時,我們可以輸入的單詞變得有限??梢韵胂螅覀兛梢栽诩彝鼍爸邪l(fā)出的指令幾乎是“開放”,“關(guān)閉”等等。 。更重要的是,在家庭場景中可以控制的項目是有限的,并且任何一個操作的流程都很短。
因此,在第一代Echo揚聲器之間的對話中,輸入和輸出是可枚舉的,并且在開始和結(jié)束時都有一個過程。 Echo的最佳質(zhì)量是它選擇一個封閉的域場景,它極大地控制了用戶的期望。 ,獲得了更好的體驗。
亞馬遜回聲演講者
從上面兩個例子中,我可以看到封閉域?qū)υ捒蛟诋a(chǎn)品設(shè)計中有幾個不同的特征。
3.1.1一:封閉域?qū)υ拰嶋H上是工作流的擴(kuò)展
事實上,封閉域中的“封閉”一詞,無論主題數(shù)量,輸入和輸出,或?qū)υ捿喆?,對話過程,都是封閉的,而封閉代表有限集合。工作流可以由ifttt設(shè)計的原因是因為有限的設(shè)置,只有有限的條件可以用來設(shè)計清晰和合理的工作流程。
封閉式對話通常旨在解決特定問題或需求。從結(jié)果來看,它的效果似乎更“有用”。但是,從過程的角度來看,封閉域名對話并不是真正的創(chuàng)新。與工作流程相比,它的效率沒有顯著提高,但它更接近于交互式體驗中的人類語言交互本能,因此大多數(shù)封閉域?qū)υ捲O(shè)計為助手或秘書,如阿里小米,百度。
3.1.2第二:封閉域?qū)υ拡鼍笆菃我豢煽氐?/p>
由于具體目的,封閉域通常位于單個定義的場景中。百度的秘密在下面的圖片中,兩個紅色的盒子部分是各種封閉場的預(yù)設(shè)場景。每個看似簡單的功能實際上都是一個特定的封閉域?qū)υ?例如,它正在屏幕截圖中使用。圖片笑話。
秘密機(jī)器人
顯然,在不同的封閉域?qū)υ捴?,對話的四舍五入要求是不同的。這個笑話是一個單輪對話。在秘密產(chǎn)品中,通過圖中的藍(lán)框,“然后另一個”設(shè)置輸入,不斷增強(qiáng)用戶輸入的統(tǒng)一性。 “賣出”的封閉式對話是標(biāo)準(zhǔn)的工作流程,有興趣的學(xué)生可以自己嘗試。
3.1.3第三:封閉域的邊界處理非常重要
封閉域的一個非常重要的問題是用戶可能隨時跳出封閉域,開始談?wù)撈渌黝},或者不按照預(yù)設(shè)規(guī)則打牌。
例如,與Microsoft Xiaobing的封閉域名對話稱為“Little Ice Dog”。
在正常的邏輯中,發(fā)送給小冰的用戶照片應(yīng)該是狗的照片,但是有些用戶可能已經(jīng)發(fā)送了不是狗的照片,如下所示,那么這次是邊界情況并且需要額外的處理。用戶可以發(fā)送語音,文本和任何其他照片,每個照片都需要單獨設(shè)計。
微軟小冰“小秉志犬“
更重要的是,在封閉域?qū)υ挼倪吔缭O(shè)計中,很難完全萬無一失,因為用戶輸入可能很奇怪,所以最好和最愉快的方式是使用開放域?qū)υ拋怼暗讓印薄?
3.2開放域?qū)υ?/p>
開放域名與封閉域名相關(guān)。由于會話機(jī)器人的主題幾乎完全來自用戶,并且每個用戶可能有任何輸入,因此主題不會是詳盡無遺的,并且在多個場景中跳躍和跳躍,從而形成所謂的開放域?qū)υ?,即“你”可以?談話'。
2011年,“小黃雞”誕生于人人網(wǎng),這是中國最早的開放式域名對話機(jī)器人。之后最好的發(fā)展是微軟小兵。
開放域名對話的最大特點是輸入不能用盡,輸出不能用盡,對話沒有確切的終點,根本沒有進(jìn)程。
我們一般都想測試一個機(jī)器人是否聰明,通常是開放域名對話,著名的“圖靈測試”通常面向開放域名對話。
就可以攜帶的會話輸入范圍而言,開放域?qū)υ捑拖袼阉饕妗N覀兛梢栽诎俣人阉髦休斎肴魏螁卧~。百度幾乎總會給出結(jié)果頁面(敏感詞除外);相應(yīng)地,在開放領(lǐng)域?qū)υ捴虚g,我們可以說什么,機(jī)器人應(yīng)該回答每一句話。
3.2.1開放域?qū)υ挳a(chǎn)品設(shè)計的基本原則
對話需要雙方平等。
與微軟小兵聊天時,有時我甚至不知道她是真機(jī)還是假機(jī)器——事實上,這并不重要,小冰正在解決開放域名聊天的核心問題:如何不斷為用戶創(chuàng)建主題,從而繼續(xù)聊天的精力?
談到主題制造,讓我們首先看看如何制作開放式域名對話機(jī)器人:
幾乎所有的開放域名對話語料庫都來自互聯(lián)網(wǎng)上的公開對話,如百度知道,知道,豆瓣,郵政欄等。這些對話由人們組成;然后,當(dāng)一個機(jī)器人放置其中的一些時,當(dāng)時在場景中重復(fù)這些詞,我們無法判斷這個機(jī)器人是否是一個真實的人 - ——這是開放域?qū)υ挋C(jī)器人制造的基礎(chǔ)。
當(dāng)我們與看起來像人的機(jī)器人聊天時,因為場景發(fā)生在人與人對話的場景中,根據(jù)“知識詛咒”的原則,我們可以很容易地引入一種“另一個人是也是一個人的“感覺。一旦對方的回復(fù)就像一個人,我們就會認(rèn)出她是一個人。
人與人之間的關(guān)系源于長期的溝通和溝通。聊天本身就是一個開放的域名;那些愿意與機(jī)器人聊天的人會越來越喜歡機(jī)器人。
我們知道對話機(jī)器人是一種新興產(chǎn)品。第一批早期采用者是所謂的“種子用戶”。這些人建立了機(jī)器人和機(jī)器人之間最早的親密和信任形式,積累了后續(xù)對話機(jī)器人的發(fā)展。非常寶貴的經(jīng)驗。
3.2.2開放域?qū)υ挋C(jī)器人的兩個產(chǎn)品陷阱
首先,面向用戶的機(jī)器學(xué)習(xí)
許多人認(rèn)為機(jī)器人和人們交談的對話越多,他們學(xué)習(xí)的語料庫越多,他們從語料庫中獲得的問題就越多,這是一個巨大的誤解。由于用戶的輸入是不可預(yù)測的,因此從用戶收集的語料庫非常奇怪,并且許多咒罵咒語非常不適合作為開放域?qū)υ捳Z料庫。由于用戶的語料庫是龐大且不規(guī)則的,因此語料庫清理非常困難并且不能使用。
其次,沒有人指導(dǎo)人格
由于開放域的語料庫完全來自因特網(wǎng),因此難以控制機(jī)器人的回復(fù)語言。如果你沒有想到它,機(jī)器人有時會很有趣,有時是野蠻的,有時是無知的,有時是夸張的,有時是聰明的。在用戶的心目中,不能使用一個或幾個顯式形容詞來描述它。這將導(dǎo)致非常尷尬的結(jié)果。用戶持有“調(diào),玩”的態(tài)度,繼續(xù)思考。建立用戶親密度和信任幾乎是不可能的。
四,對話機(jī)器人的用戶價值
現(xiàn)在,我們試圖回答一個問題:為什么對話機(jī)器人需要開放域名對話?有什么價值?挑逗是不是很有趣?
這是一個非常復(fù)雜的問題。
由于對話機(jī)器人具有“開放域?qū)υ挕焙汀胺忾]域?qū)υ挕保瑥挠脩舻慕嵌葋砜?,對話機(jī)器人意味著它更像是人而不是機(jī)器。與人類一樣,這意味著用戶在與人們互動時更愿意與對話機(jī)器人進(jìn)行交流——而曾經(jīng)如此,“個性”和“意識”是用戶主動強(qiáng)加給對話機(jī)器人的標(biāo)簽。 。例如,幾年前播放的10086短信聊天,《生活大爆炸》中的Rajsh Fantasy Siri是一個性感的妹妹,所有這些都源于用戶主動強(qiáng)加于對話機(jī)器人的人類標(biāo)簽。
這給著陸對話機(jī)器人產(chǎn)品的設(shè)計帶來了巨大的挑戰(zhàn)。
我們知道任何產(chǎn)品都能夠與用戶建立親密和信任。這種親密和信任建立在產(chǎn)品體驗的基礎(chǔ)之上。它基于產(chǎn)品的核心需求。 +“產(chǎn)品制造驚喜”我們依靠產(chǎn)品因為問題,因為對產(chǎn)品的驚喜和喜愛,打開我們的手機(jī),我們會發(fā)現(xiàn)一些貼心的產(chǎn)品 - 一目了然;比如開車的人經(jīng)常會信任很高的德圖,追隨者《那年花開月圓時》人們會喜歡騰訊的視頻。
同樣,機(jī)器人需要有一個基本的個性,這需要大大關(guān)閉人與機(jī)器人之間的親密和信任。建立了對話機(jī)器人的親密和信任,它也站在“解決需求”和“驚喜”中。
從產(chǎn)品角度來看,解決需求是通過封閉的域?qū)υ捦瓿傻?,而開放域?qū)υ拕t繼續(xù)產(chǎn)生意外。
4.1問答,助理,聊天,只需要哪一個?
在已經(jīng)登陸的對話機(jī)器人產(chǎn)品中,它們基本上分為純到C和B再到C。由于對話機(jī)器人的交互功能是針對最終用戶的,因此很少有純粹的B產(chǎn)品場景(即使它是,它的邏輯類似于C邏輯)。這意味著對話機(jī)器人的用戶是一些終端個人用戶。
那么,讓我們來看看這些對話機(jī)器人在C中解決了哪些核心要求。
在我們所知道的對話機(jī)器人產(chǎn)品中,有主要客戶服務(wù)的問答機(jī)器人,主要秘書的助理機(jī)器人,以及純粹有趣的對話的聊天機(jī)器人。他們只是落后于他們嗎?
4.1.1事實:很難問,情緒計算還有很長的路要走
聊天是一個容易被激發(fā)的場景,但它很容易快速消失。只有情感依賴才能持久。
以微軟小兵為例。小冰最熟悉的功能是聊天,但從用戶活動和保留周期的角度來看,用戶最有可能被激勵的時間是首次采用,每周更新,重大更新和激活。在此之后,活動將在上升后迅速上升。為什么是這樣?因為人與機(jī)器之間的對話是基于有趣的話題,并且通過自然情感依賴成為像《HER》這樣的薩曼莎,所以至少還有很長的路要走。
情緒計算不僅僅是一個數(shù)學(xué)或計算機(jī)科學(xué)問題,它還是一個產(chǎn)品問題。
因為情感不是一個具象問題,人們的情緒變化會隨著時間,環(huán)境,他人,自己的思想等而變化;和情緒不是連續(xù)計算,你喜歡女孩,這并不意味著總是與她的情感依賴,而是通過一些關(guān)鍵的情感觸覺,來完成情感聯(lián)系。
在微軟小冰的許多設(shè)計功能中,“獲得用戶的昵稱”和“解鎖”是一種斷點式的情感觸覺。通過微妙的產(chǎn)品設(shè)計,它希望堅持用戶。
4.1.2一個問題:用戶真的需要秘書機(jī)器人嗎?
助手對話機(jī)器人的發(fā)展是基于其他各種線上和線下服務(wù)的改進(jìn),如Siri;只有當(dāng)你的手機(jī)里有手機(jī)時,“鬧鐘”,“提醒”,“通話”等等。 “只有當(dāng)你想使用”搜索引擎“的功能時,Sire的助手功能才有效。此時,你可以向Siri發(fā)出指示,”提醒我明天晚上8點返回微信。
大約兩年前,YC孵出魔術(shù)聳人聽聞的兩個半球,無數(shù)模擬器爭先恐后地探索“助手型”機(jī)器人,直到今天,很少有效 - — —我們普通人真的需要一個秘書對話機(jī)器人嗎?
我們先來看兩個例子。
第一個例子——我想設(shè)置這樣的鬧鐘;每周一,周三,周五早上8點: 15”
如果我使用iPhone的鬧鐘程序,那么我的步驟將如下:
第1步:解鎖手機(jī)屏幕;
第2步:左右滑動以找到警報程序;
第3步:點擊鬧鐘程序;
第4步:單擊以創(chuàng)建新警報;
第5步:選擇鬧鐘時間為“l(fā)dquo; 8: 15&rdquo ;;
第6步:選擇重復(fù)時間為“星期一,星期三,星期五”;
第7步:單擊“完成”。
如果我選擇Siri來幫助我,那么我的步驟大致如下:
第1步:長按主頁按鈕喚醒Siri;
第2步:對Siri說“請幫助我在每周一,周三和周五將鬧鐘設(shè)置為8: 15”;
第3步:Siri反饋設(shè)置成功并完成。
現(xiàn)在讓我們看看第二個例子——通過秘書班對話機(jī)器人稱為外賣VS通過“饑餓””叫外賣。
在秘書機(jī)器人中,稱為外賣的過程大致如下:
第1步:發(fā)出“售完”訂單,并在機(jī)器人推薦的餐廳中尋找您想吃的食物
第2步:如果沒有合適的,請輸入您要吃的商店的名稱
第3步:在推薦列表中選擇所需的膳食,或直接輸入您想吃的膳食
第四步:輸入“確認(rèn)”執(zhí)行訂單,輸入訂單信息并提交訂單
第5步:支付并等待外賣,您可以詢問進(jìn)餐情況
在饑腸轆轆中,調(diào)用外賣的過程大致如下:
第1步:在餐館列表中選擇您想吃的食物
第2步:如果沒有合適的,搜索商店
第3步:在推薦列表中選擇所需的膳食,或直接輸入您想吃的膳食
第4步:確認(rèn)訂單,確認(rèn)訂單信息,提交訂單
第5步:支付,等待接收外賣,您可以檢查交付進(jìn)度
這兩個例子之間的本質(zhì)區(qū)別是什么?
您會發(fā)現(xiàn),如果您通過Siri設(shè)置鬧鐘,我實際上只做一件事:向Siri發(fā)送一條指令,然后獲取所有內(nèi)容——與我通過應(yīng)用程序的工作相比,節(jié)省了近70%的步驟。但是,如果它被稱為外賣,我需要向機(jī)器人發(fā)出一系列指令,但與App一樣多的步驟。
這里有兩個關(guān)鍵點——
如果助手機(jī)器人可以一步到位,它將大大提高效率和體驗,這是一個新的需求升級;
如果一個工作流程可以一步解決,那么機(jī)器人需要完成的數(shù)據(jù)信息是巨大的,這是一個核心產(chǎn)品難題;
第一個關(guān)鍵點,只要我們考慮一下,我們就會發(fā)現(xiàn),在不考慮語音識別的準(zhǔn)確性的情況下,我可以用一條指令實現(xiàn)任何目標(biāo)。例如,“幫我叫車”,“幫我拿貨”,“幫我支付水電費”,“幫我訂機(jī)票”,其余的都不在意,這種體驗簡直就是贊不絕口。
我們來看看第二個關(guān)鍵點。
拿上面的外賣示例,如果用戶只需要一個句子,“幫我請一個外賣”,那么機(jī)器人需要完成的信息至少包括“餐館”,“< ;; meal”,“l(fā)dquo; “價格”,“用餐交貨時間”,“交易地點”,“支付信息”等,在此信息中,“交貨時間,交貨地點,支付信息”相對靜止。信息可以使用一次很長時間。但是,“餐廳,餐,價格”是動態(tài)信息。如果你想每次都自動獲取它,這意味著機(jī)器人需要很好地了解“主用戶”。否則,只有一兩個推薦的偏差太大,經(jīng)驗將減少幾乎一個數(shù)量級。從本質(zhì)上講,助手機(jī)器人現(xiàn)在是一個強(qiáng)大的推薦引擎,代表著巨大的魅力和光明的未來。
4.1.3一個肯定:Q&A機(jī)器人非常有價值
最常見的問答機(jī)器人是“客戶機(jī)器人”,例如京東的JIMI,阿里的小米機(jī)器人,以及一些銀行的客戶服務(wù)機(jī)器人,但它們更像是FAQ過濾器。
讓我們考慮一下Ali Xiaomi的用法。如果我問阿里小米“我的快遞怎么沒交付? ”,它回應(yīng)的方式主要是在關(guān)于“交付”的通常問題中向我拋出最常見的答案,例如它會告訴我“你的快遞已經(jīng)簽署,如果沒有收到可能會被放在門口” ”
為什么這些公司必須是問答機(jī)器人?效率自然是第一位的,無論是節(jié)省手工客戶服務(wù)成本,還是為了節(jié)省通信時間,效率都得到提高。為什么這些公司如此重視效率?因為他們的客戶最接近他們自己的利潤池,所以質(zhì)量控制是所有交易型企業(yè)的核心。您看到京東的客戶服務(wù)和QQ客戶服務(wù)只是一個地下,因為京東用戶是JD現(xiàn)金流的主要參與者,而QQ的普通用戶并不是他們現(xiàn)金流業(yè)務(wù)的關(guān)鍵人物。
那么,讓我們回過頭看看機(jī)器人的問答。它實際上對頭部問題實施全面過濾,然后通過對話形式反饋給用戶。如果用戶真的問長尾問題,那么問答機(jī)器人就無法回答它。您可以將問題反饋給手動客戶服務(wù)。直接響應(yīng)以滿足用戶90%的問題是Q&A機(jī)器人的核心目標(biāo)。對于其他類似的購物指南,輔助訂單管理等,這是一個附加在頭部問題上的增值經(jīng)驗優(yōu)化。
4.2對話機(jī)器人真的適合分為“聊天,助手,問答”這三類?
這是業(yè)內(nèi)比較流行的分類。讓我們來看看這種分類的視角。
如果從技術(shù)角度來看,對話機(jī)器人應(yīng)分為“開放域”和“封閉域”,我們已經(jīng)討論過了,這里不再贅述。
如果您站在用戶角色中,則對話機(jī)器人可以分為“教育版”,“醫(yī)學(xué)版”,“二級版”等。
如果您是從商業(yè)角度來看,對話機(jī)器人可以分為純To到C和To B,然后分為To C.
因此,這種分類更像是從抽象場景的角度來看。幾乎所有場景都分為這三類,無論是主題聊天,面向任務(wù)還是提問。實際上,向后看,我們所知道的幾乎所有應(yīng)用都屬于此類別。
然而,對話機(jī)器人不是移動互聯(lián)網(wǎng)時代的應(yīng)用程序。這是一個復(fù)雜的。直接劃分不是一個好的產(chǎn)品分類。
您不會在淘寶視頻聊天中,也不會在支付寶中。幾年前百度試圖在大搜索中推出“直接號碼”以顛覆微信公眾號,結(jié)果以失敗告終。
原因很簡單:在移動互聯(lián)網(wǎng)時代,幾乎每個應(yīng)用都有自己獨特的定位。擁有自己獨有的產(chǎn)品主路徑,不在自己的路徑邏輯中的行為不能順暢流動;每個應(yīng)用程序似乎都有自己的咒語,不能輕易打破彼此之間的障礙。
然而,在對話機(jī)器人產(chǎn)品的世界中,這些障礙將會崩潰。
如果我們站在整個產(chǎn)品世界的世界中,事實上,我們每個人都生活在一個混合社會,手頭的工具幫助我們完成一項小任務(wù),但幾乎每件小事都需要與人打交道。食物,衣服和住房也不例外。如果每次與外界的聯(lián)系都被視為一種流動,那么最大流量就是頻繁而沒有實際任務(wù)的人之間的互動,相對較小的是做特定任務(wù):你每天都會遇到一些人,但是你不會每天都買衣服。
幾乎所有的流量都是圍繞人們之間的互動形成的,你會發(fā)現(xiàn)一個規(guī)則:你越接近現(xiàn)金流,它就越不活躍,流失率就越高。騰訊的產(chǎn)品,百度的產(chǎn)品都是通過流量漏斗實現(xiàn)的,而阿里的產(chǎn)品是直接拉動人們買東西,利潤空間直接建立在交易上,而且有必要不斷刺激人們購買和購買。
在所有產(chǎn)品中,社交產(chǎn)品最接近“社會社會”,這是現(xiàn)金流中最活躍和最活躍的社會社會??梢哉f,幾乎所有互聯(lián)網(wǎng)產(chǎn)品都是最活躍的,可以是任何產(chǎn)品流產(chǎn)品的來源,所以你看,阿里做了他想做的一切社交產(chǎn)品。
說一個圓圈,然后我們回來看看最小的社交產(chǎn)品原型。
社交產(chǎn)品分為即時社交和時間延遲的社交互動。簡單的比喻是聊天和朋友圈,兩者都基于“語言對話”。由于幾乎所有事情都可以在社交產(chǎn)品的場景中完成,因此可以看到前一段時間在互聯(lián)網(wǎng)上流傳的微信“發(fā)現(xiàn)”頁面。
微信“發(fā)現(xiàn)”頁面網(wǎng)絡(luò)地圖
對話機(jī)器人具有社會產(chǎn)品的普遍性,其原因只有一個 - ——對話機(jī)器人的交互場景自然是社交產(chǎn)品交互場景。
當(dāng)我們從用戶的角度看對話機(jī)器人時,用戶根本不明白什么是“開放域名,封閉域名”,并且不明白什么是“聊天機(jī)器人,助手機(jī)器人,問答機(jī)器人”,用戶還記得生活在那些類別中,沒有辦法記住,只要有一個對話框輸入框放在用戶面前,就像微信輸入框一樣,由于知識詛咒,用戶會去他理解的模擬輸入框,它將是輸入他們想要輸入的任何自然語言,它可能是一個草率的單詞,它可能是一個任務(wù),或者它可能是一個問題。面對京東JIMI機(jī)器人,我們無法阻止用戶做無聊的操作。
此時出現(xiàn)的一個重大問題是開放域名對話不時發(fā)生,只要答案不好一兩次,體驗不滿意度就會增加。從產(chǎn)品設(shè)計的角度來看,我們能做的就是讓用戶的輸入盡可能的可控,就像阿里小米已經(jīng)做的秘密一樣。這就是為什么每當(dāng)我們設(shè)計對話機(jī)器人時,我們總是試圖獲得更多涉及一些開放域?qū)υ挼墓δ茳c。為什么當(dāng)我們談?wù)搶υ挋C(jī)器人時,我們不能總是繞過它?在開放領(lǐng)域下不聰明”這個問題。
4.3像朋友一樣的朋友是對話機(jī)器人的最后一端嗎?
如果你在微信上,請問你最好的朋友“幫我看一下戰(zhàn)狼2的票,我想晚上去看看,他/她怎么回答你?
我想,他可能會說,“你去看看《戰(zhàn)狼2》,不要打電話給我?!”,他可能會說“我走了,讓我們一起去”,他會繼續(xù)說“我看著它,你的家里有萬達(dá)門票,晚上7點,一起去上班嗎?
如果你問魔術(shù)同樣的問題,它的答案就是讓你告訴他什么時候看。它幫你挑了五個。每次都是對的,有一些靠近你,有些有折扣,等等。
你喜歡什么樣的經(jīng)歷?這很難說。如果你站在封閉的領(lǐng)域,Magic的算法比朋友好得多,選擇更豐富,但與朋友的經(jīng)驗就是生活。
我想這可能是對話機(jī)器人的最終結(jié)局。它的存在仍然是為了幫助人們更好地解決一系列問題;但是像命令機(jī)一樣呆在那里并不是太愚蠢,但應(yīng)該像朋友一樣。你也可以幫助你。它曾經(jīng)在對話機(jī)器人產(chǎn)品的討論中討論過:對話機(jī)器人應(yīng)該更“有趣”,或者更“有用”,事實上,從這個最后的角度來看,這個討論毫無意義,你可以說你的朋友只有使用,但是很無聊嗎?
V.對話機(jī)器人的產(chǎn)品價值
以上關(guān)于對話機(jī)器人的用戶價值的討論有一些分歧。我們回過頭來討論關(guān)于其產(chǎn)品價值的文章的最后部分。
要對待產(chǎn)品,我們必須從業(yè)務(wù)角度出發(fā),否則就沒有意義。從商業(yè)角度來看,對話機(jī)器人有三個核心產(chǎn)品價值。
5.1跨場景連接是可能的
由于對話機(jī)器人的交互模式是原始的和單一的,機(jī)器人背后的所有計算邏輯都是隱藏的,機(jī)器人可以成為連接不同場景下服務(wù)的獨立橋梁,這樣用戶就可以只在一個場景中完成交互。談話場景。
例如,在Skype for business中,有一個機(jī)器人可以幫助通過Skype協(xié)作的人預(yù)訂會議室,設(shè)置工作項提醒,代理自動回復(fù)等等。——最初,每個作業(yè)都是跨場景,現(xiàn)在只有一個對話可以解決交互場景。如果你去大,你可以說,如果伙伴機(jī)器人可以在以后逐漸出現(xiàn),那么在聊天中完成預(yù)訂機(jī)票,預(yù)訂酒店,甚至管理家用智能空調(diào),這些交叉場景可能是由合作伙伴完成。
5.2交互式升級帶來的深度交通深度
無論是打字還是說話,都有很多方式可以交談。如果它是聲音,它將帶來革命性的變化。
5.2.1指數(shù)流量增長
百度DuerOS和亞馬遜Alexa的邏輯相似,都是通過獲得所有智能硬件語音對話獲取新流量的能力,同時實現(xiàn)深度交互和流量降級。
我們知道,在互聯(lián)網(wǎng)業(yè)務(wù)中,一切都是圍繞流量完成的,要么流量足夠,要么流量足夠大。由于對話帶來的交互效率提高,單個用戶獲得的流量頻率呈指數(shù)增長。如果典型互聯(lián)網(wǎng)產(chǎn)品的PV/UV是單個數(shù)字,那么對話機(jī)器人的PV/UV(實際上是對話頻率)至少兩位數(shù)。
有些人很難成為互動場景,例如在家里向Echo揚聲器發(fā)號施令,現(xiàn)在他們通過對話機(jī)器人成為現(xiàn)實。沒有一個應(yīng)用程序比對話機(jī)器人更親密和親密,創(chuàng)造了如此多的高頻交互。最終的結(jié)果可能是我們生活的方方面面都在觸及網(wǎng)絡(luò)。每次互動都是所謂的PV,指數(shù)交通映射了一個人生活的方方面面。
5.2.2高頻端計算
我有一個猜測:因為對話機(jī)器人是一種高頻交互場景,最直接的影響可能是需要在設(shè)備端提供更強(qiáng)大的計算能力;或許某些封閉域或開放域計算能力是直接預(yù)裝客戶端,無論是硬件還是軟件。如果網(wǎng)絡(luò)能力無法以相同的速度增長,那么終端的計算能力將得到提升——我想這是一些AI公司會做芯片的原因之一。
5.3深耕土壤沉淀數(shù)據(jù)
正是由于流動的深度沉積,每個用戶的多維數(shù)據(jù)沉淀變得可能。當(dāng)每個用戶的平均數(shù)據(jù)量和維度增長十倍時,它意味著什么?
對于百度來說,至少必須增加廣告費。對于Ali,它可以向該用戶銷售更多東西。簡而言之,ARPU(每用戶平均收入)將增長很多,這些是最直接的商業(yè)價值。在我之前的文章《人工智能「風(fēng)口」,先行者為什么是搜索引擎?》中,我分析了其中一些邏輯關(guān)系,因為尚未開發(fā)出流量的深度維度值,它可能是以前從未見過的處女地。
六,總結(jié)
以上是對話機(jī)器人的一些更明顯的分析和討論。作為一種正在發(fā)展的新興產(chǎn)品,對話機(jī)器人仍有許多值得探索的細(xì)節(jié)。由于篇幅,我只能說這么多,希望我還能繼續(xù)深入探索。
在個人層面上,我對To C對話機(jī)器人產(chǎn)品的未來持樂觀態(tài)度——但它的產(chǎn)品路徑非常長且多種多樣,與我們過去經(jīng)歷的移動互聯(lián)網(wǎng)產(chǎn)品有很大不同;但它并沒有改變其產(chǎn)品,任何產(chǎn)品都是從用戶的需求出發(fā)。
對話機(jī)器人帶來了一種新的互動形式,可能帶來前所未有的新產(chǎn)品服務(wù)體驗。
我們每個人都渴望機(jī)器人時代的到來,也許很遙遠(yuǎn),也許已經(jīng)在路上了,誰知道呢?
周一周五 8:30 - 18:00
客服QQ