大规模数据清理策略:跨分库数据删除实践 提出针对大规模数据存储场景下的数据清理策略,在分库分布式架构下,对老旧数据进行安全、高效的删除。策略适用于多种数据库类型和分库架构。 PHP 35 次浏览 2024-06-12
Datascope:基于链接视图的大规模数据集交互式查询系统 为了解决多维数据可视化和探索的需求,提出了一个名为 Datascope 的交互式查询系统。该系统致力于创建一个全新的数据搜索界面,为用户提供一种探索数据的替代方法。Datascope 利用诸如 crossfilter 和 dc.js 之类的 JavaScript 库,支持创建可扩展的动态仪表板,以实 Webpack 25 次浏览 2024-06-09
每小时7200万数据量如何处理?Flink与Kafka实时流架构应对大规模数据 每小时 7200 万的数据量,一听就挺吓人。你要是之前没做过任何,那系统扛不住也正常。大数据这事儿,不是简单堆服务器能的,得整点靠谱的架构和工具,比如 Kafka 搭配 Spark 或 Flink,搞实时流,响应也快。像这种流量级别,预不能少。清洗、去重、转格式,啥都得来一遍。工具可以选 Tenso Actionscript 0 次浏览 2025-06-16
iHarmony4:用于图像协调的大规模合成数据集 图像协调通过调整前景外观使其与背景区域一致,从而实现合成图像的协调。虽然创建合成图像相对容易,但生成协调的输出却非常耗时且需要高超的技术。 目前,缺乏用于图像协调的高质量公开数据集。iHarmony4 是一个专门为图像协调构建的合成数据集,它包含四个子数据集:HCOCO、HAdobe5k、HFlic HarmonyOS 25 次浏览 2024-06-22
大规模并行处理器编程实践 《大规模并行处理器编程实践》由Kirk Hwu所著,是一本实用指南,为开发者提供了深入理解与操作大规模并行处理器的具体方法。这本书以实践为导向,通过丰富的案例,引导读者逐步掌握并行编程的技巧和策略,进而提升程序的执行效率。对于希望提高并行处理能力,提升系统性能的读者来说,本书是一本不可多得的参考资料 C++ 20 次浏览 2024-05-11