Python中使用unrar解压并筛选RAR归档文件

Python中使用unrar解压并筛选RAR归档文件

本教程介绍了如何在Python中使用unrar模块解压RAR归档文件并根据指定文件类型进行筛选。

步骤:

  1. 安装unrar模块
pip install unrar
  1. 导入模块
import unrar
  1. 解压RAR文件
rarfile = unrar.UnrarFile('archive.rar')
rarfile.extractall()
  1. 筛选文件类型
import os

file_types = ['.doc', '.docx']
for root, dirs, files in os.walk('extracted_files'):
    for file in files:
        if file.endswith(tuple(file_types)):
            print(file)
  1. 根据文件名相似度匹配文件
from difflib import SequenceMatcher

def compare_files(file1, file2):
    return SequenceMatcher(None, file1, file2).ratio()

for file1 in files:
    for file2 in files:
        if compare_files(file1, file2) > 0.9:
            print('匹配文件:', file1, file2)
zip 文件大小:795.95KB