發布者:大(dà)尋網絡|TIME : 2016-06-01
廈門(mén)網站(zhàn)建設:因為(wèi)不論國外還(hái)是國內(nèi)的電(diàn)子商務企業,他們的相同點都是以業務為(wèi)導向。eBay的做(zuò)法是用數(shù)據驅動商業,其上(shàng)所有(yǒu)的數(shù)據産品都是針對業務而生(shēng),數(shù)據部門(mén)需要對不斷變化的用戶需求找到解決之法,也就是從客戶的行(xíng)為(wèi)數(shù)據中來(lái)尋找價值。
喜歡海淘的朋友(yǒu)應該對eBay并不陌生(shēng),如果你(nǐ)還(hái)不了解,可(kě)以把eBay+PayPal理(lǐ)解為(wèi)淘寶+支付寶的組合,當然eBay不僅有(yǒu)C2C還(hái)有(yǒu)B2C的模式。雖然介紹了背景,但(dàn)今天要說的并不是電(diàn)子商務的發展,而是大(dà)數(shù)據在電(diàn)商內(nèi)如何發揮價值。
因為(wèi)不論國外還(hái)是國內(nèi)的電(diàn)子商務企業,他們的相同點都是以業務為(wèi)導向。eBay的做(zuò)法是用數(shù)據驅動商業,其上(shàng)所有(yǒu)的數(shù)據産品都是針對業務而生(shēng),數(shù)據部門(mén)需要對不斷變化的用戶需求找到解決之法,也就是從客戶的行(xíng)為(wèi)數(shù)據中來(lái)尋找價值。
行(xíng)為(wèi)數(shù)據用混合的手段來(lái)處理(lǐ)
數(shù)據是eBay發展的基礎和(hé)價值所在,所以eBay數(shù)據服務和(hé)解決方案團隊從eBay成立的第一天就已經存在,從數(shù)據倉庫到數(shù)據分析再到數(shù)據服務,部門(mén)的名字一直随着發展在不斷變化。但(dàn)萬變不離其宗,數(shù)據服務和(hé)解決方案團隊就是一個(gè)針對數(shù)據展開(kāi)想象的部門(mén)。
eBay數(shù)據服務和(hé)解決方案團隊分布在美國西雅圖、聖何塞以及中國上(shàng)海,而中國團隊全職和(hé)外包人(rén)員總共将近有(yǒu)100人(rén),其中有(yǒu)不同的職位和(hé)分工,包括數(shù)據科學家(jiā)、數(shù)據工程師(shī)、商業需求分析師(shī)、産品經理(lǐ)四大(dà)類。兩個(gè)區(qū)域的團隊互相協作(zuò),共同開(kāi)發核心數(shù)據的同時(shí)也支持不同的業務部門(mén)。
eBay中國數(shù)據服務和(hé)解決方案團隊主管李炜
eBay目前整體(tǐ)有(yǒu)四大(dà)系統,其中三個(gè)為(wèi)生(shēng)産系統,一個(gè)為(wèi)測試開(kāi)發系統。生(shēng)産系統包括:第一,保存交易型數(shù)據和(hé)用戶數(shù)據的企業及數(shù)據倉庫(Enterprise Data Warehouse);第二,Teradata為(wèi)eBay特别定制(zhì)的分析系統,主要進行(xíng)非結構化的用戶行(xíng)為(wèi)數(shù)據處理(lǐ);第三,專門(mén)為(wèi)數(shù)據分析師(shī)使用,方便快速找到想要的數(shù)據。eBay中國數(shù)據服務和(hé)解決方案團隊主管李炜指出,前兩個(gè)系統主要為(wèi)生(shēng)産環境做(zuò)批處理(lǐ),最後一個(gè)系統是幫助數(shù)據科學家(jiā)進行(xíng)測試和(hé)制(zhì)作(zuò)分析報告。
由于eBay電(diàn)子商務的性質,其用戶行(xíng)為(wèi)數(shù)據占80%以上(shàng),而通(tōng)過買家(jiā)和(hé)賣家(jiā)的行(xíng)為(wèi)數(shù)據eBay可(kě)以做(zuò)很(hěn)多(duō)個(gè)性化的應用。買家(jiā)更喜歡買哪些(xiē)種類下的産品,有(yǒu)哪些(xiē)購物習慣、什麽時(shí)間(jiān)購買,這些(xiē)數(shù)據可(kě)以幫助賣家(jiā)了解哪些(xiē)是自己最大(dà)的客戶群,以及基于機器(qì)學習對未來(lái)的熱點市場(chǎng)進行(xíng)預測。
“eBay的行(xíng)為(wèi)數(shù)據都是非結構化數(shù)據,這對于關系型數(shù)據庫的壓力非常大(dà)。”李炜談到。因此eBay則使用了混合方案,使用Hadoop來(lái)應對海量非結構化數(shù)據,将原始數(shù)據首先加載到Hadoop上(shàng),完成行(xíng)級結構化處理(lǐ),在将這些(xiē)預處理(lǐ)好的數(shù)據送到不同的系統,之後處理(lǐ)已經模式化的數(shù)據和(hé)半結構化數(shù)據。
eBay擁有(yǒu)龐大(dà)的Hadoop節點和(hé)Teradata節點,這也帶來(lái)了三大(dà)挑戰:
第一、不同系統間(jiān)的數(shù)據搬移,eBay每天産生(shēng)的數(shù)據量是巨大(dà)的,這些(xiē)數(shù)據要在多(duō)個(gè)平台上(shàng)搬移,在搬移的過程中要保證不同系統中數(shù)據的同步和(hé)數(shù)據質量。
第二、不同系統的管理(lǐ),随着eBay系統平台的越來(lái)越多(duō)樣化,對于Teradata和(hé)Hadoop等系統的管理(lǐ),以及搬移數(shù)據的管理(lǐ)都需要不斷增強。
第三、技(jì)術(shù)能力提升,不同平台有(yǒu)不同的技(jì)術(shù),這就需要員工具備綜合技(jì)術(shù)能力。
隻要有(yǒu)業務需求就有(yǒu)數(shù)據産品
對于eBay來(lái)講數(shù)據平台要具備高(gāo)可(kě)靠性、高(gāo)可(kě)用性、易用性。eBay與Teradata的合作(zuò)已有(yǒu)20年之久,eBay也是目前Teradata最大(dà)的客戶之一。李炜回顧了Teradata系統在eBay上(shàng)這20年中經曆了多(duō)次演變,到目前為(wèi)止eBay的核心數(shù)據、交易型企業級數(shù)據和(hé)用戶行(xíng)為(wèi)數(shù)據都在Teradata上(shàng)進行(xíng)存儲管理(lǐ)和(hé)應用。
以數(shù)據驅動商業是eBay的文化,大(dà)數(shù)據平台最終是為(wèi)了産生(shēng)價值,現在除了傳統的數(shù)據整合,eBay在各個(gè)業務環境中都有(yǒu)着不同的數(shù)據産品。
eBay有(yǒu)一款針對賣家(jiā)的線上(shàng)免費工具Seller Hub,可(kě)以為(wèi)每一位賣家(jiā)進行(xíng)深入的分析,哪些(xiē)商品更暢銷,産品如何标價才能具備競争優勢等。這中間(jiān)會(huì)使用到數(shù)據模型,李炜強調模型不僅僅從eBay網站(zhàn)中的所有(yǒu)類目中調取價格,還(hái)會(huì)抓取亞馬遜等電(diàn)商網站(zhàn)的價格,而且還(hái)會(huì)比對相似産品的關聯價格,最終為(wèi)賣家(jiā)提供指導價格。
結合了自身數(shù)據和(hé)第三方數(shù)據也讓eBay可(kě)以完善網站(zhàn)上(shàng)不能捕獲的一些(xiē)數(shù)據來(lái)繪制(zhì)用戶畫(huà)像,像性别、職業、收入等。包括對用戶畫(huà)像進行(xíng)分級,哪些(xiē)是潛力賣家(jiā),哪些(xiē)是高(gāo)風險買家(jiā),從而更精準地進行(xíng)市場(chǎng)推廣。
剛剛更多(duō)說的是eBay如何用數(shù)據提供一些(xiē)産品,在內(nèi)部eBay同樣用數(shù)據在優化自身網站(zhàn),在對頁面的設計(jì)、新功能的設計(jì)上(shàng)都會(huì)提供相應的建議。
2016年,eBay還(hái)将繼續發展B2C和(hé)C2C市場(chǎng),但(dàn)是eBay有(yǒu)B2C、C2C、二手貨多(duō)種賣家(jiā)的存在,如何管理(lǐ)各個(gè)類目中的商品成為(wèi)一個(gè)非常大(dà)的挑戰,eBay要做(zuò)到把大(dà)部分的類目最終關聯到結構化的産品系列中,實現精細化的管理(lǐ)。
用戶的需求是多(duō)樣化的,eBay也會(huì)有(yǒu)越來(lái)越多(duō)的需求,未來(lái)與Teradata的合作(zuò)上(shàng),不僅僅是硬件一體(tǐ)機層面,在美國eBay已經開(kāi)始使用了Teradata提供的雲服務,并且已經落地了一些(xiē)具體(tǐ)的應用。(廈門(mén)網站(zhàn)建設文章來(lái)自百度新聞)
聯系地址:廈門(mén)市軟件園二期望海路23号之二204|A3~A5
電(diàn)話(huà):0592-5786385
傳真:0592-5786385
QQ:413141903