簡介:社區(qū)內(nèi)容通常包括UGC和PGC。由于關(guān)鍵詞和內(nèi)容多樣性豐富、用詞規(guī)范程度參差不齊,搜索引擎需要對關(guān)鍵詞和內(nèi)容進(jìn)行智能語義分析,識別出用戶真正的查詢意圖,找到最全面最相關(guān)的結(jié)果滿足用戶需求。本文將詳細(xì)介紹如何通過“開放搜索(OpenSearch)內(nèi)容增強(qiáng)版”在社區(qū)論壇場景的應(yīng)用,提升用戶搜索體驗,帶來更多的業(yè)務(wù)轉(zhuǎn)化
社區(qū)的核心是用戶,用戶進(jìn)入社區(qū)的主要目的是為了消費(fèi)內(nèi)容。內(nèi)容可以是廣義的圖文、音頻、視頻,也可以是通過社區(qū)找到解決問題的方法。優(yōu)質(zhì)的內(nèi)容能提升用戶的活躍度,為平臺帶來流量與時長,實(shí)現(xiàn)用戶增長和留存,獲得更多業(yè)務(wù)機(jī)會和收益。
"搜索"作為社區(qū)直接獲取內(nèi)容的最有效途徑,每個社區(qū)都在不斷解決下面的搜索效果問題:
如何準(zhǔn)確理解用戶的搜索意圖,返回最匹配的結(jié)果?
如何通過內(nèi)容傳播的差異化,個性化來提升用戶的搜索體驗,增強(qiáng)社區(qū)歸屬感和忠誠度?
如何在社區(qū)里不同領(lǐng)域,不同垂類,不同頻道間的內(nèi)容召回中實(shí)現(xiàn)交互和連接?
如何實(shí)現(xiàn)非商業(yè)化內(nèi)容與商業(yè)化內(nèi)容更好的融合與發(fā)展?
本文將帶著以上幾個思考,為大家解析內(nèi)容社區(qū)行業(yè)搜索特點(diǎn)和挑戰(zhàn),以及介紹阿里云智能開放搜索-內(nèi)容社區(qū)行業(yè)增強(qiáng)版的解決方案和應(yīng)用實(shí)踐。
內(nèi)容行業(yè)搜索業(yè)務(wù)需求
? 更多的曝光機(jī)會——無結(jié)果率低;
? 更好的搜索質(zhì)量——搜索相關(guān)性高,更高質(zhì)量的排序;
? 更豐富的業(yè)務(wù)特征——結(jié)合業(yè)務(wù)特性調(diào)整搜索結(jié)果;
? 更全面的配套功能——智能糾錯、熱搜、底紋、下拉提示等配套能力;
? 更低的擁有成本——相較自建搜索引擎更低的開發(fā)、資源、運(yùn)維成本;
? 更便捷的開發(fā)使用——上線周期短,降低搜索引擎開發(fā)、效果調(diào)優(yōu)難度;
? 用戶搜索意圖指向性強(qiáng)——主搜聚集多個頻道內(nèi)容,搜索結(jié)果相關(guān)性要求更加精準(zhǔn);
以某論壇社區(qū)為例,產(chǎn)品線覆蓋多個平臺,包含網(wǎng)頁、APP、小程序等形式,同時業(yè)務(wù)上區(qū)分多個頻道。隨著業(yè)務(wù)的發(fā)展,首頁綜合搜索(后簡稱“主搜”)的流量越來越大,各種付費(fèi)、引流業(yè)務(wù)接入,對搜索流量的運(yùn)營變得更加重要,對主搜的業(yè)務(wù)訴求越來越多,需要聚合多個頻道的內(nèi)容,同時搜索結(jié)果相關(guān)性要求更加精準(zhǔn),在考慮文本相關(guān)性的前提下,要加入更多的商業(yè)因素考慮。
成熟的搜索引擎涉及離線模塊、在線模塊、查詢理解服務(wù)、算法平臺等系統(tǒng),所需大量開發(fā)、算法調(diào)優(yōu)以及持續(xù)的復(fù)雜運(yùn)維工作,由于人力有限,自建搜索系統(tǒng)很難滿足業(yè)務(wù)需求。
常見搜索業(yè)務(wù)場景
文章搜索
博文、問答、心得分享等內(nèi)容搜索
精品內(nèi)容、熱帖發(fā)現(xiàn)
付費(fèi)資源引流
標(biāo)簽分類過濾、篩選
(配圖來自阿里云開發(fā)者社區(qū))
話題搜索
熱門活動、話題互動
PGC、UGC
熱搜、底紋、下拉提示等搜索引導(dǎo)
個性化、時效性
(配圖來自阿里云開發(fā)者社區(qū))開放搜索內(nèi)容社區(qū)增強(qiáng)版
方案架構(gòu)
功能介紹
內(nèi)容行業(yè)增強(qiáng)版基于阿里巴巴最新算法功能,貼合不同垂類內(nèi)容搜索場景的痛點(diǎn)和需求,提供了內(nèi)容行業(yè)專屬的智能語義理解能力、向量召回、排序算法,為內(nèi)容行業(yè)的搜索性能和效果準(zhǔn)確性提供雙重保障,并有效的解決了超大詞庫數(shù)據(jù)導(dǎo)致的搜索延遲高、資源消耗大、搜索無結(jié)果率高等行業(yè)重難點(diǎn)問題。針對內(nèi)容行業(yè),開放搜索還提供了向量模型,以實(shí)現(xiàn)向量召回及多路搜索,提高查詢準(zhǔn)確率,并提供多模態(tài)搜索解決方案。
通用版VS內(nèi)容行業(yè)增強(qiáng)版
1.功能差異
2.查詢分析效果對比
行業(yè)增強(qiáng)版較通用版相比在查詢分析功能上做出了更深入的優(yōu)化,不僅在通用版的基礎(chǔ)上更新了常見bad case,而且針對內(nèi)容行業(yè)集各家之所長,豐富已有詞庫。
分詞:(以空格分詞)
拼寫糾錯:
內(nèi)容行業(yè)向量召回
針對內(nèi)容行業(yè)的垂類行業(yè)數(shù)據(jù)分布提供高質(zhì)量的向量召回模型,保證長尾query,包含錯別字query,依賴同義詞改寫召回query的召回效果
向量召回
CTR預(yù)估模型-個性化搜索效果
1.基于Seq行為建模,實(shí)現(xiàn)個性化搜索
例如:用戶連續(xù)搜索:“面試”,“Java”兩個詞和用戶只搜索“Java”的結(jié)果是有差異的,實(shí)現(xiàn)個性化召回,針對性滿足不同用戶的搜索需求,提示用戶搜索體驗。
2.深度排序模型DeepRanking
模型參數(shù)規(guī)??梢赃_(dá)到1000億級別,保障更優(yōu)搜索效果,且模型訓(xùn)練、使用成本低,遠(yuǎn)低于自研人力+機(jī)器+研發(fā)支持所用成本。
3.深度召回模型集合阿里云達(dá)摩院的NLP能力,提升搜索效果,降低無結(jié)果率
針對用戶和數(shù)據(jù)特點(diǎn),結(jié)合阿里巴巴長期技術(shù)積累,深度定制模型結(jié)構(gòu),做到Make for you的特有深度模型結(jié)構(gòu)。
增強(qiáng)版接入流程
輕松接入,快速上手,一鍵式接入行業(yè)模板,可根據(jù)自身業(yè)務(wù)自定義選擇功能,并滿足非技術(shù)人員業(yè)務(wù)干預(yù)調(diào)優(yōu)與數(shù)字化運(yùn)營需求; 點(diǎn)擊體驗交互式demo
表結(jié)構(gòu)設(shè)計
詳情可參考應(yīng)用結(jié)構(gòu)--->創(chuàng)建多表join。
數(shù)據(jù)接入
開放搜索支持用戶通過數(shù)據(jù)源將數(shù)據(jù)接入搜索,也支持無數(shù)據(jù)源,通過API/SDK/控制臺上傳文件的方式導(dǎo)入數(shù)據(jù)詳情如下:
RDS數(shù)據(jù)源配置
MaxCompute(原ODPS)數(shù)據(jù)源配置
POLARDB數(shù)據(jù)源配置
API/SDK數(shù)據(jù)導(dǎo)入
內(nèi)容社區(qū)行業(yè)模板配置
功能選擇,垂類選擇“IT”行業(yè)為例,模板功能可自行勾選(默認(rèn)全選)
其中模板功能包括:查詢分析(IT詞權(quán)重、IT同義詞包、文本向量化等)、排序策略(多路搜索、文本相關(guān)性、向量相關(guān)性)、下拉提示。
搜索測試
1.如需使用“IT向量索引”搜索,需要先配置查詢分析-文本向量化功能,并添加對應(yīng)的IT向量索引:
2.在搜索測試中進(jìn)行測試:
效果定制服務(wù)
如果有深度召回、排序效果調(diào)優(yōu)、個性化搜索需求,開放搜索團(tuán)隊專家支持效果定制服務(wù),可填寫咨詢問卷:阿里云登錄 - 歡迎登錄阿里云,安全穩(wěn)定的云計算服務(wù)平臺
案例實(shí)踐
某技術(shù)社區(qū)作為中文IT內(nèi)容社區(qū),致力于為中國軟件開發(fā)者提供知識傳播、在線學(xué)習(xí)、職業(yè)發(fā)展等全生命周期服務(wù),旗下包括多款產(chǎn)品。
自開始接觸阿里云開放搜索產(chǎn)品,在一年的時間里陸續(xù)接入PC端、移動端的多個平臺,覆蓋首頁搜索、博客、下載、問答等細(xì)分業(yè)務(wù)的頻道搜索。通過開放搜索,為旗下產(chǎn)品的用戶提供高質(zhì)量的搜索服務(wù),并通過搜索能力的優(yōu)化帶來更多的業(yè)務(wù)轉(zhuǎn)化,提升整體業(yè)務(wù)收入。
對比基于開源自建的服務(wù)CTR提升超過80%
后續(xù)算法專家通過深度定制模型不斷幫客戶調(diào)優(yōu),每曝光用戶帶來點(diǎn)擊次數(shù)提升16.7%,Item-CTR提升11.8%,效果還在持續(xù)提升中;
來源:阿里云云棲號
IT時代網(wǎng)(關(guān)注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創(chuàng)文章版權(quán)所有,未經(jīng)授權(quán),轉(zhuǎn)載必究。
創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專注于TMT領(lǐng)域早期項目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個人。創(chuàng)客100創(chuàng)投基金對IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨(dú)特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點(diǎn)。
小何
小何
小何
來自: 【人物】滴滴創(chuàng)始人程維回顧與Uber競爭:中國互聯(lián)網(wǎng)從來沒有輸過--IT時代網(wǎng)
小何
來自: 少年頭條對壘中年騰訊:解局兩代互聯(lián)網(wǎng)公司商業(yè)之戰(zhàn)--IT時代網(wǎng)