400萬個交易所錢包是怎么挖出來的?| 專訪Chain.info技術負責人李禎

文| Carol 來源 | PANews
早前,PAData聯合專注于區塊鏈交易的一站式數據服務平臺Chain.info起底全球BTC交易市場中主流交易所的錢包,從400萬余個錢包的余額變化和錢包間資金流轉情況觀察第三季度交易所的競爭格局。點擊閱讀《400萬個錢包揭示BTC資金網絡 三大所誰在失守存量市場?》
根據PAData的分析,交易所的交易業務共涉及三類錢包,分別是充提錢包、熱錢包和冷錢包,其中充提錢包的數量占比達到99.9%。而且不同交易所三類錢包的特征差異也反映出各交易所資金流轉的不同風格。
從錢包余額可以看出交易所的真實市場份額,今年第三季度,BTC余額最多的交易所是Huobi,三類錢包共存有29.6萬枚,其次是Binance,共有24.1萬枚。而Huobi則以第三季度總共超過5萬的凈流入進一步鞏固了其在BTC交易市場中的地位。
交易所間的轉賬還鉤織了一張資金網,其本質是交易所間存量博弈的競爭現狀。從統計來看,BinanceBitstampOKEXHuobi之間的資金流轉十分活躍。其中,OKEXHuobi之間的資金互動最活躍,但Binance流失了10.4萬枚BTC到其他交易所。
那么作為一切分析的基礎——交易所錢包是如何挖掘出來的呢?PAData專訪了數據合作伙伴Chain.info的技術負責人李禎,詳解交易所錢包背后的挖掘邏輯。

以下是訪談實錄:
PAData交易所的充提錢包是什么?有什么特征?
Chain.info李禎:用戶在交易所開設了一個賬戶以后,交易所會給用戶提供一個充幣地址。現在主流交易所為用戶提供的充幣地址一般是不可更換的,也就是一個用戶對應一個充幣地址,除非交易所大面積統一更換。這類地址占比大概是交易所的地址總數的99.9%以上。
PAData1個交易所的充幣地址代表1個用戶,那是不是可以從交易所的充提錢包數量來看這個交易所的實際用戶規模有多大?
Chain.info李禎:可以這么看,但是也不能完全這么理解。存在兩種情況使得實際用戶規模與充提錢包數量不等,一種開戶后充過一次幣,之后再也不使用了,那這就不好確認是否還是實際用戶(實際活躍的用戶),另一種是以某種方式繞過KYC開戶,那么一個實際用戶可能對應多個充提錢包。
PAData交易所的熱錢包是什么?有什么特征?
Chain.info李禎:熱錢包是屬于交易所的聯網錢包,主要作用是負責普通充幣地址和冷錢包之間的資金流通以及用戶提幣。熱錢包占比極小,大致數量也就是1030之間,但是它的交易數極大。
PAData交易所的冷錢包是什么?有什么特征?
Chain.info李禎:冷錢包是交易所的離線錢包,交易所會將大部分的資產存儲在冷錢包中。冷錢包只與熱錢包進行資金流通,具有交易總數較小,單次交易總額比較大的特點
PAData用戶在交易所中的交易,體現在交易所錢包層面上,比特幣是如何流轉的?
Chain.info李禎:用戶在交易所發生的一切交易行為都是在交易所的數據庫里發生的,這是無法被監控到的,因為這些數據是交易所握有的。
但是用戶的一些行為也會跟交易所產生一定的關系。比如說在充值的時候,用戶和交易所的充值地址發生了一次聯系,然后在提幣的時候,用戶會從交易所的熱錢包或者其他的充幣地址拿到一筆錢。比如說你想提0.1個比特幣,剛好有一個用戶的賬戶里有0.2個幣的話,就可能從這個充值地址里面就直接提給你。
比特幣就是這樣流入或流出交易所的。但用戶的幣不一定會流入熱錢包或冷錢包。

PAData根據BTCUTXO模型,如何判斷一筆交易涉及的多個地址的歸屬?
Chain.info李禎:BTC的交易使用UTXOUnspent Transaction Output)模型,每一個UTXO屬于一個地址,一個地址可以包含多個UTXO,每一個UTXO是不可拆分的。在交易時,發起交易的用戶使用自己的UTXO作為交易輸入,構造新的UTXO作為交易輸出,這意味著輸入側的地址通常屬于同一個主體。
所以我們先考慮輸入一側的地址,根據比特幣構建交易的方式可知,出現在輸入側的地址屬于同一個主體。這就是錢包地址挖掘的第一步——縱向挖掘。
PAData在縱向挖掘邏輯下,是否可能存在特殊情況,即輸入側的地址由多個主體擁有?
Chain.info李禎:確實存在一種小概率的情況,這種情況在比特幣交易里面稱為混幣,指一筆交易里面含有多個主體的地址。但是這里我們基本可以忽略這種情況,原因在于,混幣操作對交易所來說沒有什么意義,一是容易造成一些安全問題,另外,我們對所有交易所的地址進行了一次分析,發現并沒有兩個交易所的地址出現在同一筆交易的輸入一側。
PAData除了縱向挖掘以外,還有哪幾種挖掘邏輯?
Chain.info李禎:還有前向挖掘和后向挖掘兩種。
前向挖掘是在縱向挖掘基礎上對輸出側地址做判斷的過程,判斷邏輯是基于普通轉賬的找零交易形態。在前向挖掘中,被挖掘地址必須出現在輸入一側,且輸入側地址數不為二,輸出側地址數一定為二。其中,有一個輸出地址的BTC值擁有4位以上小數時,那么這個地址和輸入方一樣屬于同一個主體,這個地址就是找零地址。
前向挖掘中輸入一側通常都是交易所的冷錢包,然后輸出一側有一個地址是交易所的熱錢包,然后剩下的地址才是交易所新的冷錢包。這個特性是我們先整理了很多交易所的交易數據后提煉出來的。
與前向挖掘相對的是后向挖掘。在后向挖掘中,被挖掘地址必須出現在輸出一側,且輸入側地址數為一,輸出側地址數一定為二。根據錢包的不同特征可以判斷輸出側的被挖掘地址是熱錢包地址,且在該筆交易中發送給熱錢包地址的金額一定要大于100個BTC,那么符合條件的交易中的三個地址屬于同一個主體,并且輸入側的地址可能是冷錢包地址。
PAData這三個挖掘方法之間有順序嗎?
Chain.info李禎:先進行縱向挖掘,把交易所的地址信息先盡量都挖到,然后再通過錢包特征或其他的方式分析出熱錢包,我們首先確定它是熱錢包了,然后才能進行后向挖掘去找冷錢包。總的來說會按照縱向挖掘——前向挖掘——后向挖掘的順序進行。
PAData通過這些挖掘方法,最先挖掘到的是哪類錢包呢?
Chain.info李禎:最先挖到的是充提錢包。其實第一個充值錢包就是我們隨便找一個交易所,然后注冊成為用戶,這樣就會有一個充值地址了。然后我們就往里面可以放一些錢進去,這時候就可以看到這個錢的流動,順著就能找到熱錢包和冷錢包。
PAData假如在一個標簽都沒有的情況下,可以怎么樣來判斷交易所比特幣的流轉呢?
Chain.info李禎:這樣的話就比較難了,但是還是可以追蹤的,比如說我們現在也在監控大額的交易,現在鏈上如果出現了大額交易的話,我們會對他們的地址進行溯源,去追蹤發現一些交易所。我們現在已經找到了幾個這樣的交易所,而且體量還不小,但是我們不知道他們他們是誰。
PADataCoinbase也是頭部的比特幣交易所之一,為什么沒有此次數據挖掘沒有覆蓋到Coinbase的錢包數據?
Chain.info李禎:Coinbase的熱錢包很有意思,它不像其他的交易所熱錢包,是一個固定的或者幾個固定的,Coinbase的熱錢包是一次性使用的。所以這個是我們現在正在攻克的主要方向。
相關資訊
  1. “隱私是最基本的人權”—專訪門羅幣社區負責人Justin Ehrenhofer

    2019-01-23
  2. 專訪以太經典中美社區負責人:太多ETC內幕你從未聽說過

    2018-08-02
  3. 專訪李國權:未來之路——擴展區塊鏈的包容性

    2017-11-27
  4. 交易所大戰數字交易所的十字路口:李林大戰徐明星

    2019-01-08
  5. 比特幣挖礦倒計時:2100萬個幣, 還剩400萬個未挖掘

    2018-07-24
  6. 央行約談國內大型交易所負責人,比特幣跌破6000元!

    2017-01-06
  7. 獨家專訪丨普華永道EMEA區塊鏈負責人:加密貨幣的發展需要Libra這樣的大項目,需要巨頭的支持

    2019-06-27
  8. 資深技術專家劉曉濤出任Vite北美研發部負責人

    2018-07-30
  9. 騰訊區塊鏈技術負責人李茂材:未來的公鏈不太可能是一條,各種擴容方案可能是混合的

    2019-01-22
广东11选5稳赚技巧