计算法学方法入门实践指南
计算法学的入门笔记,结合了数据、AI 和文本挖掘几大块内容,挺适合法律+技术跨界的小伙伴啃一啃。讲得不深但覆盖面还挺全,像预、标准化这些实操的也提了,配着自己项目练练手蛮合适的。
计算法学方法的比较清晰,从背景讲到应用场景,再带你过一遍核心技术,比如数据预、文本清洗、标准化/归一化,这些都挺常见的,尤其是做 NLP 或法律知识图谱那块的。
数据这块讲得还不错,像怎么做数据清洗、怎么去噪、哪些字段该保留,虽然不是代码形式,但逻辑思路清楚。标准化和归一化也分别解释了适用场景,比如你要喂模型前统一尺度,用MinMaxScaler
一类的工具就方便。
文本也提了一嘴,比如先抽取关键信息、去掉无效词、再统一格式。这一整套流程,放在法律文书里还挺常见的,比如拆分案由、抽取判决要素啥的。
如果你平时在用 Python 跑 NLP、或想把法律文本数据用起来做点,这份文档算是个比较靠谱的“入坑地图”。后面想深入可以看看数据预技巧或者Python 面试常见问题,进阶用得上。
哦对了,如果你对大数据容器化环境感兴趣,顺手带你看下Docker Compose 合集,部署起来省事多了。
,这份文档适合边看边实操,有点像老司机给你画的第一张导航图。别期望它代码多,但方向感给得蛮准。
17.25KB
文件大小:
评论区