发布日期:2026-01-12 浏览次数:
免费USDT游戏,免费USDC游戏,免费链游,USDT小游戏,USDC平台,注册送虚拟币/盘点2025年最新免费USDT/USDC小游戏和链游平台,支持中文注册,无需实名认证,注册送币,边玩边赚,适合加密新手与老玩家!
近期团队在GitHub上推出了一个开源轻量级区块链交易数据采集工具箱BlockchainSpider。
近些年来,工业界和学术界都致力于挖掘区块链交易数据,在区块链系统中实施钓鱼检测、资金追踪、账户画像等数据分析任务。然而,区块链系统包含海量交易数据,针对每种任务定制化数据接入模块成本不菲。
BlockchainSpider致力于打造一个轻量化的区块链交易数据采集工具箱,驱动下游模块轻松接入区块链交易数据分析任务。
BlockchainSpider从区块链浏览器、节点RPC服务、区块链资讯网站中收集信息,提供以下三大功能:
BlockchainSpider只需一条命令即可启动,协助数据分析师和研究人员完成链上数据解析、交易追踪和标签爬取等功能。以下是BlockchainSpider的功能架构。
命令执行后,可以在项目根目录下找到名为data的路径,该路径存储了所提取的区块数据。所提取的区块数据存储为CSV格式,以下是交易数据示例:
事实上,用户还可以根据自己的需求,修改数据存储方式、过滤数据类型或指定如何处理所爬取的数据,详细使用方式参见项目GitHub主页提供的文档。
BlockchainSpider特色在于轻量化。在开发者测试中,绝大多数功能可运行在1核2G的计算设备上,下面将以交易追踪和交易解析为例,讲解BlockchainSpider如何实现轻量化。
在交易追踪任务中,算法需要在超大规模的区块链交易网络中寻找一个子图,该子图应该尽可能包含给定账户的资金来源和去向。
为了优化查询过程,BlockchainSpider采用了图扩展框架,从给定账户出发,逐步搜索资金链路上有关账户的交易数据,无需一次性加载所有链上交易数据。
4、Pop:选择下一个要expand的账户/交易 根据图扩展框架,BlockchainSpider实现了五种常见的追踪策略(详见项目文档)。 值得一提的是,BlockchainSpider也允许用户根据实际业务的需求,修改和运行自定义的策略。
在交易解析任务中,BlockchainSpider从RPC服务中提取数据,本地无需维护大规模区块链账本数据库,进而保证轻量化。
然而,在实际测试中发现,RPC请求通常有较大延迟。为了提升交易解析效率,BlockchainSpider使用了请求级并行技术,通过并行调用RPC,保证交易解析高度并行化。
下图展示了两种并行调用方式,即批处理并行(常见的基于RPC服务的交易解析技术原理)和请求级并行。
批处理并行能够同时发起多个调用,但必须等到当前所有调用都执行完毕以后才进行下一次批处理并行,这增加了额外的等待时间。
BlockchainSpider选择请求级别的并行,它无需等待其他调用执行完毕,减少无效等待时间,进而加快调用速度。
BlockchainSpider致力于成为轻量且高效的区块链交易数据分析工具箱。
随着技术的不断优化和应用场景的持续拓展,我们期待所有领域相关的数据分析师、安全从业者和开发者提交PR和Issues,进一步激发学术界和产业界的深入实践,共同构建一个更加简单、易用的区块链交易数据分析框架。
简单理解就是区块链查询分析工具,每个人可以通过写类 sql 语言查询区块链上的所有信息。
经过大神测试,Dune 的数据是有延迟的,不过大局观上来说,数据更新还是挺及时,可以自由的更新可视化面板。
之前想爬取所有数据,但是工作量还是比较大,所以想通过这个先筛选一些聪明账号,然后快速爬取历史数据做分析,这样会比较快。
最终就能查询出来,在最近的 24h 内,通过 uniswap 购买了多少 DAI 的代币
我觉得这句话直接讲出了区块链的精髓,区块链本质上就是消耗一定的 gas,让你的数据永久的存储在分布式账本上。现在我们可以通过 dune 来查询这个分布式账本的数据,因为区块链它是公开的。
那么 ETH、BSC、Polygon、solana 这些都是对应的数据库,它下面的各种合约应用可以看成一个表,这张表通过各种 transitions 将数据链接了起来。
就可以得到 aave 合约中存储方法的相应数据,通过这个数据可以做一些筛选
_user:发起存款的钱包地址 _reserve:作为抵押品存放的代币地址 _amount:存入的代币数量 _timestamp:交易被挖掘到区块链的时间戳
然后再这个结果中筛选 USDC 历史借贷大于 1000000 的账号,最后根据 USDC 数量从大到小排序
------------- 我只是搬运工,如有冒犯之处请联系我,及时删除