<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 大數據如何精準營銷?淘寶、京東等數據被爬取,有業務員日賺5千

    “不需要不需要,以后別再給我打電話了。”說完,代昌(化名)重重地將手機摔在了沙發上。代昌是河北邢臺清河縣一家民營企業的實際控制人,最近幾年來,他接到的騷擾電話數量明顯增多。騷擾電話正成為大數據時代的“頑疾”。

    記者調查發現,一些所謂“大數據”公司數據來源可疑,甚至有些大數據公司并沒有數據。新京報記者經過多地暗訪、臥底發現,有大數據公司號稱可以采集到任意指定網站或者APP的訪客手機號;另一家號稱“中國互聯網營銷服務第一品牌”公司的“鷹眼智客”官網則顯示:“有你所需要的一切”。

    7月底,新京報記者臥底“鷹眼智客”發現,其實際上是利用爬蟲技術,從淘寶、京東等網站上爬取到店家手機號后,用于營銷。此外,借助該軟件,通過微信附近的人,用戶可任意設定虛擬位置后批量申請好友,還能“站街”釣魚營銷。

    有安全專家表示,當用戶發生上網行為時會發送數據包,內含行為痕跡、手機號等信息。一旦涉及某一方發生泄露,通過抓取這個數據包便可以解析出來用戶的敏感信息。網絡爬蟲則分為合法爬蟲和惡意爬蟲兩種。一些所謂的大數據公司本身沒有數據來源,而是通過爬蟲手段獲取他人的數據。

    在網絡空間,數據戰爭已進入白熱化。2019年5月份,國家互聯網信息辦公室發布的《數據安全管理辦法》征求意見稿第十五條也規定了,“網絡運營者以經營為目的收集重要數據或個人敏感信息的,應向所在地網信部門備案。”此外,大多數網站早已對惡意爬蟲構建反爬措施并作出聲明嚴厲禁止,有律師直言,“突破、繞開第三方平臺的反爬蟲策略、協議時,或涉嫌非法獲取計算機信息系統數據罪、提供侵入非法控制計算機信息系統程序工具罪。”

    臥底“最全”大數據公司

    淘寶、京東等多家網站數據被爬取

    記者發現一家名為“鷹眼智客”的大數據公司號稱“中國互聯網營銷服務第一品牌”。其官網宣稱:“有你所需要的一切”。據官網介紹,“鷹眼智客”歸屬于鄭州共贏科技有限公司。

    7月29日,新京報記者來到該公司面試地點——鄭州市金水區金城國際廣場A座,通過面試得到試崗資格,主要工作是推銷一臺包含“鷹眼智客大數據營銷系統”的電腦。在約一百平方米的房間里,充斥著啪啪啪敲擊鍵盤的聲音。房間內的三十多名業務員共同組成了共贏科技的“商務部”。

    據其官網顯示,“鷹眼智客”系統涵蓋QQ營銷系列、微信營銷系列、綜合采集系列、論壇貼吧系列、郵件營銷系列五大模塊,擁有218個小功能。此外,其還宣傳稱“已成功為2800多家企業提供互聯網營銷服務,覆蓋120多個行業”。其中綜合采集系列號稱可精準采集目標客戶信息,覆蓋全網11大B2B平臺,4大搜索引擎,7大地圖,準確率達90%。

    記者試崗期間任務是熟悉軟件流程,并得到主管發的一份“終端客戶聊天話術”。“終端客戶聊天話術”顯示,其數據來源于各大行業網站、各大平臺以及各大地圖等,“像阿里、百度、騰訊等等只要在網上公開留過痕跡的這些信息通過我們的核心技術SPILDER多線程技術都可以給你采集到。”

    據極驗產品總監程柏(化名)介紹,其核心技術實際上是網絡爬蟲技術。據其介紹,目前互聯網流行的網絡爬蟲種類比較多,信息采集類的網絡爬蟲主要是腳本和模擬器類爬蟲。

    記者發現,“鷹眼智客精準營銷系統”共包含數據采集系列、QQ營銷系列、社群論壇營銷、綜合營銷工具五個模塊,覆蓋了客戶數據采集到營銷的整條產業鏈。

    其中,數據采集系列模塊包含地圖行業采集、綜合數據采集、阿里巴巴采集、慧聰網采集、單頁名錄綜合采集、大眾點評網采集、淘寶商家信息采集、中國制造網采集、團購外賣商家采集、阿里國際站采集、八方資源平臺采集、京東商家采集十二個功能。

    記者測試發現,該套軟件操作十分簡單,每個功能還附有相應的教學視頻來指導。7月30日,通過該軟件,記者成功獲取大量手機號。

    以淘寶商家信息采集為例,記者在該系統中的淘寶商家采集功能中輸入關鍵詞“服裝”后,成功采集到北京地區淘寶賣家的82條信息,共耗時10分鐘。在軟件彈出框右下角還附有“導出電話鋪”的按鈕,采集得到的信息包括類型(店鋪等級)、掌柜名稱、地區、電話、店址等多個維度。

    此外,記者還對該系統的京東商家采集、地圖行業采集、阿里國際站采集等功能依次進行測試,均獲成功。

    附近的人有多近?

    軟件任意定位,還可“站街”釣魚營銷

    “你得放開了玩,大聲喊出來!”在記者第一天早上上班之前,部門經理將業務員分成兩支隊伍,輪番結對玩一種“美女與野獸”的游戲。據該公司的工作人員介紹,玩這種游戲是為了調動業務員的積極性,培養團隊榮譽感。

    記者發現“鷹眼智客”自帶教學視頻,通過該視頻,記者試崗期間對工具中微信營銷的八個功能逐個進行測試。以該模塊中的微信定位營銷功能為例,用戶使用該功能需用手機模擬器登錄微信。按照添加模式不同,該軟件分為添加附近的人、添加指定QQ、搖一搖、添加群成員四種。

    記者調查發現,點擊微信定位營銷“獲取經緯度坐標”,會彈出一個頁面。假如在該彈出頁面輸入國貿位置后,用戶可將坐標定位到國貿,并看到國貿地區“附近的人”。利用該軟件用戶可以同時添加多個虛假位置,也支持多個微信號同時操作。

    該套軟件還有一定的反封號機制。視頻教程顯示,在參數設置中,用戶可以自己選擇好友驗證的次數、間隔時間以及每個位置發送驗證申請的個數。“剛剛使用的話少添加一些,比如說添加五六個,逐步增加,最多的話添加十個以內,有一段時間間隔之后再次添加。”

    設置好位置及參數設定后,用戶可在軟件中“驗證消息”下面的空白操作區域對驗證消息進行編輯。“比如說,他是做生意的,你可以將驗證消息編輯為‘你好,我想看下你產品’,這樣的話(驗證申請)通過率會更高一些。”

    值得一提的是,該軟件還有一項名為“站街”的功能。所謂“站街”,即“如果說不想主動添加好友,只想讓附近的人看到并添加你,就可以使用站街功能。”在位置一欄的彈出對話框中,用戶只需點擊“模擬器利用此位置站街”即可“站街”。

    極驗產品總監程柏(化名)認為,“鷹眼智客”部分功能屬于黑色產業鏈。“這類群發功能有些是違背用戶意愿的,純粹的牟利行為,像我有時候也會收到這類垃圾信息,多以營銷為主,但是這類營銷很多來源并不可靠,可能會有其他黑色產業鏈和惡意引導。”

    新京報記者從“鷹眼智客”工作人員處了解到,公司為了方便客戶營銷,還提供外呼機器人(AI電話)的服務,只需要將采集到的電話號碼導入即可。

    此前,新京報曾對外呼機器人進行曝光。所謂外呼機器人,實際上是一條電話機器人系統,一天客戶呼出1000通電話。隨后,央視3·15晚會也對外呼機器人進行曝光,不法分子和違法科技公司通過探針盒子搜集用戶隱私、大數據提供支持、智能機器人提供外呼。

    大數據如何“精準營銷”

    抓取指定任意網站或APP的訪客手機號

    新京報記者通過搜索關鍵詞“大數據精準營銷”,注意到一家名為娛加科技的大數據精準營銷公司。

    企查查顯示,該公司全稱為蘇州娛加互娛網絡科技有限公司,法定代表人為吳輝。該公司成立于2018年4月19日,注冊資本200萬元人民幣,所屬行業為軟件和信息技術服務業。

    8月19日下午,新京報記者以保健品和網貸銷售的身份與吳輝取得聯系。對某些行業數據,吳輝顯得謹小慎微。“保健品暫時不行,保健品目前查得比較嚴,屬于高危敏感行業。”吳輝告訴新京報記者說。

    據其介紹,該公司的獲客系統十分精準。“你可以指定任意網站或者APP,只需要提供網站鏈接或者APP的名稱及下載鏈接,我們就可以抓取到訪客的手機號碼。”吳輝說。

    不過,其所提供的訪客的手機號碼只顯示真實的前三位以及后四位,所以只能通過他們提供的系統去進行營銷。“我們會提供一個外呼系統,可以將這些手機號提供到外呼系統里面去和客戶溝通。”吳輝介紹。獲取的中間四位被隱藏的手機號也被其稱為“脫敏數據”。

    此外,訪客獲取到的手機號也存在一定限制。“現在運營商主要做的是聯通和電信的,移動的停掉了。”吳輝說。至于為何停掉移動的,對方給出的答案則是因為“移動用戶太龐大了”。

    除了運營商,吳輝還表示,如果用戶是通過WiFi或者電腦來訪問的,也無法抓取到手機號。“它(該系統)是通過流量來訪問的,電腦端和無線網是抓取不了的,必須通過手機通信網絡。”

    為了增強說服力,吳輝建議記者“可以先花五百測試一下”。據其介紹,使用套餐為1000條起測,“我們可以簽一個費用套餐,開一個坐席,你自己去測試一下轉化率是多少。”

    吳輝提供給記者一份公司介紹。介紹文件對娛加科技獲客系統與普通網頁手機號抓取軟件做了對比,對比圖顯示,網頁手機訪客抓取軟件犯法,而娛加科技獲客系統則為“聯合聯通電信運營商正式推出的產品,合法合規,穩定安全”。

    8月19日,該公司倚為背書的聯通和電信的客服分別對此事進行否認,稱“并未提供過這種服務”。

    在介紹文件中,該公司提供給某整形美容醫院的服務也被做成了一份案例。案例顯示,該整形醫院以整形醫院哪家好、玻尿酸墊下巴、昆明隆鼻、整形醫院、美容醫院等225個關鍵詞,提交了本地同行等23個推廣網址、31個同行座機咨詢電話以及兩款醫美類APP,要求目標客戶為來自上海、年齡在16至50歲之間的女性客戶。

    該公司文件顯示,在2019年3月,每日推送100條左右的數據,共推送3053條。其中接通1872個,意向客戶873個,轉化客戶372個。接通率為61.31%,意向率為28.59%,轉化率為12.18%,獲客成本只有百度競價推廣的六分之一。

    安全研究員Jane介紹,當用戶發生上網行為時,首先向運營商發送一個數據包。該數據包經過運營商之后再傳給服務商。數據包中包含有用戶的上網痕跡、手機號等信息。“當其中某一方發生信息泄露時,不法分子可以利用這個數據包解析出來用戶的敏感信息。”Jane告訴新京報記者。

    充滿技巧的“殺單”話術

    有業務員日賺近5000元

    “公司目前有兩種計酬方式,一種是有底薪制,底薪為1500,銷售一件產品提成為10%;另一種為無底薪制,底薪為0,銷售一件產品提成為25%。”共贏科技負責面試的李夢海(化名)告訴新京報記者,“一般人都會選擇無底薪高提成的,賺得多。”一臺包含“鷹眼智客大數據營銷系統”的電腦,定價為8800元。按照定價以及提成來推算,每銷售一臺,業務員可以得到2200元。

    據李夢海介紹,共贏科技有限公司在鄭州總部共有5個小隊。記者被分配到“尖刀隊”。

    “恭喜尖刀隊甜甜出單!”7月31日下午3點50分,坐在記者右側的甜甜突然喊道。當業務員出單時,便會自己喊出“恭喜××隊××出單!”,此刻所有人便會停下案頭工作為其鼓掌。“這是一種獎勵機制。”一名工作人員向新京報記者介紹說。

    甜甜是一名新人。1992年出生的她,幾個月前來到這個公司轉行成為一名銷售。因剛入行不久,一些“殺單”的話術她并不熟練,當客戶表現得意向較強時,較為資深的業務員便會聚攏過來進行指導。據其描述,她平均每月可以成交四五單。在鄭州來講,收入十分可觀。

    所謂“殺單”,則是銷售之間常見的行話,意為和客戶成交。甜甜出單后不久,坐在記者斜對面的“馬總”(昵稱)也出了一單。

    “這已經是他今天出的第二單。按照每單提成25%的利潤來計算的話,算上獎金,他已經賺了快5000塊錢了。”甜甜說。

    這種場景在記者試崗期間頻繁出現。在尖刀隊主管楊小峰(化名)發送給記者的一份“終端客戶聊天話術”文檔中,詳細地記載了一些“殺單”技巧以及問答實錄。記者發現,當新人有客戶意向較為強烈時,經理和團隊主管便會聚攏上來出謀劃策,研究如何讓顧客上鉤。

    據甜甜透露,她“殺”的客戶是一位“做保健品的”。8月18日,記者聯系到甜甜這位客戶張娜(化名)。據其介紹,在使用“鷹眼智客”系統僅僅兩天后,她使用多年的微信號即遭到封禁。張娜說她再也不敢用了。

    合法爬蟲or惡意爬蟲

    惡意爬蟲涉非法獲取計算機信息系統數據罪

    “這肯定是合規的,因為我們不直接參與販賣數據。”該公司負責人事的李夢海告訴新京報記者說,“如果賣爬取到的數據就違法了。”

    該公司的業務員王偉(化名)則給出了不同的答案。王偉向新京報記者直言了自己的擔憂。“外呼機器人是違規的,之前曾被曝光過。”王偉說。

    爬蟲技術是為了互聯網本身信息傳播而產生的。通過網絡爬蟲,搜索引擎獲悉互聯網的內容。在網絡安全領域,也有通過爬蟲來檢測網站漏洞和網站可用性。

    “爬蟲技術的本質用途仍然存在,像百度、谷歌之類的公司,但是互聯網上面的其他黑產眼里只有利益,他們通過網絡爬蟲做二次數據封裝和用戶引流,通過數據販賣和流量牽引牟利。從用戶視角來說,危害主要有惡意營銷、網絡攻擊(網絡釣魚);從網站角度來說,危害包括網絡攻擊、薅羊毛、影響正常的企業服務、信息價值流失、用戶流失。”程柏說。

    中消協此前發布的《APP個人信息泄露情況調查報告》顯示,約86.5%的受訪者曾受到推銷電話或短信的騷擾,約75.0%的受訪者接到詐騙電話,約63.4%的受訪者收到垃圾郵件,排名位居前三位。

    對于此類爬蟲軟件,多數網站早已聲明嚴厲禁止。北京煒衡律師事務所周浩律師認為,“網絡爬蟲爬取數據需要遵守第三方平臺的Robots協議以及獲取數據的性質具有公開性,不得包含個人信息數據、商業秘密及國家秘密等信息數據。如果突破、繞開第三方平臺的反爬蟲策略、協議時,或涉嫌非法獲取計算機信息系統數據罪、提供侵入非法控制計算機信息系統程序工具罪。”

    Robots協議也稱為爬蟲協議、機器人協議等,其全稱為“網絡爬蟲排除標準(RobotsExclusionProtocol)”。

    “網站通過Robots協議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。對于搜索引擎來說是行業通用的爬取約定協議,但對惡意爬蟲來說并沒有任何約束力。”知道創宇技術總監鄧金城告訴新京報記者說。

    據騰訊發布的《2018上半年安全專題系列研究報告》(以下簡稱報告)顯示,惡意爬蟲通過分析并自行構造參數對非公開接口進行數據爬取或提交,獲取對方本不愿意被大量獲取的數據。

    報告指出,據統計,出行、社交、電商占惡意爬蟲流量目標行業分布前三位,占比分別為20.87%、18.40%、13.38%。

    周浩表示,《網絡安全法》《個人信息安全規范》都強調了,通信聯系方式(電話號碼)是重要的個人信息,非經同意不得收集。提供用來收集個人信息的工具,一旦被使用必然存在違規。

    技術發展倒逼法律完善

    收集重要數據或個人敏感數據需備案

    溯其本源,便是逐利。

    “一些所謂的大數據公司本身沒有數據來源,而是通過爬蟲手段獲取他人的數據。”程柏說。

    反爬斗爭已悄然進入白熱化。不過,“反爬”絕非易事。知道創宇404實驗室副總監隋剛介紹,規模較大的公司都會有自己的反爬機制,但“有些爬蟲可以繞過這些反爬機制”。

    技術的不斷發展在倒逼相關法律趨于完善。2019年5月份,國家互聯網信息辦公室發布了《數據安全管理辦法》征求意見稿(以下簡稱“征求意見稿”)對爬蟲技術有明確的定義和規定。其中第十六條規定,網絡運營者采取自動化手段訪問收集網站數據,不得妨礙網站正常運行;如自動化訪問收集流量超過網站日均流量三分之一,網站要求停止自動化訪問收集時,應當停止。

    “不過,第十六條在實踐操作中可能存在一定問題,對造成網絡不能正常運行也未有相應的處罰措施,這可能是將來需要完善的地方。”曾多次參與制定企業隱私政策的京師上海國際總部專職律師徐延軒說。

    同時征求意見稿第十五條也規定了,“網絡運營者以經營為目的收集重要數據或個人敏感信息的,應向所在地網信部門備案。”徐延軒認為,收集重要數據備案制度可能是未來監管的方向。【責任編輯/鄒琳】

    來源:新京報

    IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
    創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。

    相關文章
    【周二早報】新基建政策將出:實施全國一體化大數據中心建設
    同盾科技淪為“套路貸”平臺幫兇 爬蟲惹禍“斷臂求生”
    5G大數據 新技術助力新型肺炎疫情防控
    大數據如何精準營銷?淘寶、京東等數據被爬取,有業務員日賺5千

    精彩評論