今年會 IPO 的雲端獨角獸 Snowflake ticker : SNOW 的 CEO Frank Slootman 上份工作是在 ServiceNow ticker: NOW 當 CEO,也是一檔表現不錯的公司。我滿看好 SNOW 這家數據資料庫的發展,Snowflake在雲端的競爭對手包括Amazon Redshift、Google BigQuery、Microsoft Azure SQL 等等。
SNOW 迎來了兩個大物級股東,一個是奧馬哈先知,巴菲特的波克夏、另一個是新任道瓊科技成分股 Salesforce。波克夏的 13F 報告和近期操作已經越看越不像很純血的價值投資公司,蘋果水漲船高也佔到整體配置的三四成。我的看法是會與時俱進很好啦,只是會讓那些喜歡把人當神拜的文人相輕仔感到失落不知所措而已。
至於 Salesforce 的入股則沒有太多意外,目前身為 Public Service 的市佔王,投資也滿準的。十年來投了三四百家的公司,不過也很常當短線仔上市後不久就減碼賣出。投過的標的有 Stripe, Dropbox, SurveyMonkey, MongoDB, Evernote, Zoom, Twilio, DocuSign, nCino 等等族繁不及備載。
有興趣可以看一下 Salesforce Ventures 的投資清單,紮實實踐了我全都要的精神:
https://www.salesforce.com/company/ventures/portfolio/
同時也有10000部Youtube影片,追蹤數超過62萬的網紅Bryan Wee,也在其Youtube影片中提到,...
「snowflake資料庫」的推薦目錄:
snowflake資料庫 在 飛鳥涼不涼的遊戲營運觀察小站 Facebook 八卦
GameMakers的這集節目,找了幾位遊戲公司資訊長,探討如何建立遊戲數據資料庫。我自己不是技術專業,雖然待過幾家大公司但也沒經手討論建構資料庫的過程,有些技術術語理解過程中有點障礙,但還是提供一點整理與看法和大家分享。
遊戲業的變化一直很快,對數據資料的要求可說走在行業的前端。早期遊戲公司對於數據只有簡單的儲存與翻看要求,現在的數據已經能協助遊戲業做出客製化分析、預測玩家的行為甚至Playtika能因此做到"千人千面".....即依據每位玩家的數據,給予最適合的遊戲功能、玩法與機率。
因此,數據儲存、整理、與工具的選擇就成了很重要的關鍵。訪談中被多次提起的是Snowflake,這是個雲資料儲存運算工具,可以整合所有來自不同的資料源,工具的使用上有許多好處,技術方面我就不多加說明,特點是他的"儲存"資料費用很便宜,也適合中小型團隊,但與會者也提到,其查詢資料的費用雖然單位小,但當玩家資料累積越來越多時,花費金額就會比你想像中高很多。
其他的工具還有提到Amplitude、Firebase、Appsflyer、Grafana等。但不要期望用一個數據資料分析工具就能完美解決所有的問題。每個工具都有長處或短處,多個工具搭配使用延伸需求外,還能減少風險,或是交叉驗證數據的準確度。
小公司剛成立時,通常會以既有市場的工具為主,這些工具便宜但客製化程度也會比較低。當公司成功的遊戲越來越多時,就有把所有數據來源標準化進行統一分析的需求,這時就要考慮那些能高度客製化的服務。
訪談最後讓三位來賓提出對於資料分析的建議,很值得反思。
ANDRE認為最重要的是「誰來確保資料的準確性」。很多數據,會因為查詢方式的不同,需求的不明確導致資料錯誤。即使資料本身即使沒有問題,也會因為使用方式,觀點不同,產生完全不同的結論。譬如, 某日新增玩家的留存是20%,而這些玩家普遍首日駐留在等級10級,看起來等級10級是造成流失的關鍵,但如果LV10玩家中有9成以上隔日會繼續玩下去,那問題顯然不是光看等級這麼簡單。
即使大家看到的數據都正確,分析人員看一層、看兩層、看多個來源,判斷角度,都會賦予數據不同的意義,最終還是回到每個人本身的專業素養。
CAURAV則認為在公司還小的時候,就應該思考整個數據資料的建置,如此在公司擴大,組建更龐大的數據分析架構時,才能盡量減少過度時期所要付出的成本。
但我認為現實上,小團隊的遊戲要先能夠成功且長線經營,才有進一步建構更完整數據系統的必要性;不過,至少可以先確認各種工具的彈性與容錯率,以及對未來自建數據系統會不會造成阻礙,會不會產生搬遷困難,這些都可以先進行考慮。
OLIVER的觀點則是我最認同的。即使建立再好的數據分析系統,公司無法建立相對應的決策文化也沒意義。怎樣從數據中找到有價值的資訊,並想辦法放大其價值,才是建立一整套系統背後的關鍵。
呈如我們在粉絲團常強調的,看數據、分析數據、和做出行動是完全不同的概念,而大多數人的數據分析旅途都止步在前兩站。
希望以上對你有所啟發。
snowflake資料庫 在 矽谷牛的耕田筆記 Facebook 八卦
What Are Snowflake IDs?
Credit by: Wei-Yu Chen (感謝分享)
本文介紹了 Universal Unique Identifiers(UUIDs)的用途及其重要性,UUID 以固定且標準的方式為每個物件產生出獨立的 ID,且 產生出來的 ID 幾乎不可能會重複導致發生碰撞。
通常 UUID 由幾個部分組合而成,像是以時間、執行節點的 MAC address,或以 MD5 hash 來生成。UUID 以 128 bits 的數字組成,為了更方便識別及操作,通常都會以十六進制來表示,總長度為 36 個字(加上連字符號 -)。也因用來產生 UUID 的亂數種子包含了時間、節點資訊等參數,所以 UUID 也具有獨特性,在分散式系統執行也不容易發生碰撞。
而為了避免在你的 apps 裡實作 UUID 的產生機制,常見會使用兩種作法,分別是:Persistence Layer Generated ID 和 ID Servers。一種使用 Database 自動產生出來的序號來作為識別物件的 ID(如 MongoDB 的 ObjectID、MySQL 的 AUTO_INCREMENT ... 等),另一種是使用獨立的 ID server 來產生物件的 ID。
以 Database 來作為序號產生器會碰到一個問題,當你在每次建立新物件時,都會需要向資料庫讀取這個物件的「自動產生 ID」,假設應用程式的規模一大,效能勢必會大受影響。
而使用 ID server(也就是本文主要介紹的 Snowflake IDs)去產生 UUID 的話,就可利用架構於 app 以外的第三方序號產生器。以 Twitter 來說,平均每秒鐘有九千個推文,在高峰期間更甚至會出現一秒 143199 則推文的流量,他們所需要的 UUID 不僅要能夠支援龐大的架構,也需要在以非常快的速度產生出 ID,這也是 Snowflake 專案的由來。
因此,Twitter 以這幾個參數來組成 UUID:
- 保留不使用的位元,固定為 0 - 共 1 位
- Timestamp(以毫秒為單位) - 共 41 位
- 機器 ID - 共 10 位
- 序列號 - 從 0 ~ 4095 依序重複使用 - 共 12 位
雖然說以 ID servers 來產生 UUID 之後,效能還是會被這種架構拖累(必須在建立物件就去向 ID server 發送請求,並等待產生出來的 ID),但這種作法和資料庫系統相比起來已經讓效能降低的問題變得更輕微。
在本文當中介紹了三種常見的 ID 產生方式:在 local app 端產生 ID、在資料庫產生 ID、集中式的 ID server 產生 ID,這些策略的選擇也根據你的使用情境而定,畢竟沒有一種一套打天下的解決方案,在選擇時仍須衡量每個專案的需求。
https://betterprogramming.pub/uuid-generation-snowflake-identifiers-unique-2aed8b1771bc
snowflake資料庫 在 Bryan Wee Youtube 的評價
snowflake資料庫 在 Travel Thirsty Youtube 的評價
snowflake資料庫 在 スキマスイッチ - 「全力少年」Music Video : SUKIMASWITCH / ZENRYOKU SHOUNEN Music Video Youtube 的評價
snowflake資料庫 在 一上市股價就翻倍,巴菲特看好的Snowflake是做什麼的? 的相關結果
9月16日,提供雲端資料庫服務的Snowflake公司在紐約證交所掛牌上市,成為史上規模最大的一樁軟體公司上市案。今年8歲的Snowflake,連向來不愛碰科技業的 ... ... <看更多>
snowflake資料庫 在 資料倉庫也SaaS,Snowflake市值緣何超700億美元? 的相關結果
Snowflake 為客戶提供了靈活且使用者友好的資料儲存和分析功能,並能夠根據計算和儲存需求的變化進行伸縮。特色包括:允許多個使用者同時在平臺上訪問和 ... ... <看更多>
snowflake資料庫 在 Snowflake 雲端資料分析 的相關結果
基本上它很像Google BigQuery or AWS的Redshift,但不太一樣的是它是可以跨不同雲端平台並統合所有的雲端資料。是一個原生的雲端資料庫,它可以當成data warehousing, data ... ... <看更多>