您现在的位置是:网站首页> 编程资料编程资料

python3 如何解压缩.gz文件_python_

2023-05-26 1413人已围观

简介 python3 如何解压缩.gz文件_python_

python3 解压缩.gz文件

python3 解压一个.gz后缀的压缩文件,如下:

#!/usr/bin/env python # -*- coding: utf-8 -*- import gzip def un_gz(file_name): # 获取文件的名称,去掉后缀名 f_name = file_name.replace(".gz", "") # 开始解压 g_file = gzip.GzipFile(file_name) #读取解压后的文件,并写入去掉后缀名的同名文件(即得到解压后的文件) open(f_name, "wb+").write(g_file.read()) g_file.close() un_gz('D:\\python36\\config.gz')

可以看到在此路径下生成一个解压后的文件

注:一开始网上看到很多类似的写法但是上面第13行的写法是以下的样子

open(f_name, "w+").write(g_file.read())

实际执行会报 TypeError: write() argument must be str, not bytes

说是打开方式的问题,按照 “wb+” 的格式解决此问题

Python3 压缩与解压缩(zlib/gzip/bz2/lzma/zipfile/tarfile)

以下代码以Python3.6.1为例

Less is more!

文件的归档 (各种格式的压缩 / 解压缩)

实际使用中仅需要使用shutil模块的压缩和解压函数就可以了, 如果想尝试其他功能, zipfile(暴力破解), tarfile(命令行)也是值得推荐的

#!/usr/bin/env python # coding=utf-8 __author__ = 'Luzhuo' __date__ = '2017/5/21' # filscondense.py 文件的归档 (各种格式的压缩 / 解压缩) # 实际使用中仅需要使用shutil模块的压缩和解压函数就可以了, 如果想尝试其他功能, zipfile(暴力破解), tarfile(命令行)也是值得推荐的 import zlib def zlib_demo(): # 对直接进行压缩 data = b'luzhuo.me' com_bytes = zlib.compress(data) print("压缩后的数据: ", com_bytes) decom_bytes = zlib.decompress(com_bytes) print("解压后的数据: ", decom_bytes) # 对数据流进行压缩 with open("file.txt", "rb") as read, open("com.txt", "wb") as write: com = zlib.compressobj(level=9, memLevel=9) for data in read: # 压缩数据并写入文件 write.write(com.compress(data)) write.write(com.flush()) # 对数据流进行解压 with open("com.txt", "rb") as read, open("temp.txt", "wb") as write: decom = zlib.decompressobj() for data in read: write.write(decom.decompress(data)) write.write(decom.flush()) def zlib_func(): ''' zlib ''' # zlib.adler32(data[, value]) // 计算数据的Adler-32校验和(比CRC32快), value:校验和的起始值(默认1) num = zlib.adler32(b"luzhuo.me") # zlib.crc32(data[, value]) // 计算数据的CRC(循环冗余校验)校验和, value:校验和的起始值,默认0 num = zlib.crc32(b"luzhuo.me") # zlib.compress(data[, level]) // 压缩字节数据,返回压缩后的字节, level:[0,9],0:无压缩,1最小压缩,9最高压缩, 默认:6 bytes = zlib.compress(b"luzhuo.me") # zlib.decompress(data[, wbits[, bufsize]]) // 解压缩, wbits:历史缓冲区(默认:15), bufsize:保存解压数据的缓冲区(默认:16384) bytes = zlib.decompress(bytes) # 压缩对象 level:压缩级别[0,9], method:压缩算法(DEFLATED), wbits:历史缓冲区大小,值越大,压缩效果更好(注:使用默认值), memLevel:内存量[1,9],值越大,效果更好更快 # strategy:策略 Z_DEFAULT_STRATEGY / Z_FILTERED / Z_HUFFMAN_ONLY, zdict:压缩字典(预期频繁出现的字节序列) # zlib.compressobj(level=-1, method=DEFLATED, wbits=15, memLevel=8, strategy=Z_DEFAULT_STRATEGY[, zdict]) com = zlib.compressobj(level=9, memLevel=9) # zlib.decompressobj(wbits=15[, zdict]) // 解压缩对象 decom = zlib.decompressobj() strs = zlib.ZLIB_VERSION # zlib版本 strs = zlib.ZLIB_RUNTIME_VERSION # 解释器运行的zlib版本 # 压缩对象 com_data = com.compress(b"luzhuo.me") # 压缩数据 # Compress.flush([mode]) // 完成剩余压缩数据的字节对象, mode:Z_SYNC_FLUSH(可进步压缩) / Z_FULL_FLUSH(可进步压缩) / Z_FINISH(完成压缩) data = com.flush() com.copy() # 拷贝压缩对象副本 # 解压缩对象 # Decompress.decompress(data[, max_length]) // 解压 data = decom.decompress(data) decom.unused_data # 将要解压的数据 decom.unconsumed_tail # 未解压的数据 decom.eof # 数据流是否已结束 decom.flush() # 完成压缩, 无法再次解压, length:缓冲区大小 decom.copy() # 异常 try: pass except zlib.error: pass # 压缩和解压缩错误而引发的异常 if __name__ == "__main__": zlib_demo() # zlib_func() # ================================== import gzip import shutil content = b"luzhuo.me" def gzip_demo(): # 类字节对象的压缩与解压 # 压缩 bytes_com = gzip.compress(content) print("字节压缩: ", bytes_com) bytes_decom = gzip.decompress(bytes_com) print("字节解压: ", bytes_decom) # 对gzip文件的读写操作 # 写入 with gzip.open('box.gz', 'wb') as write: write.write(content) # 读取 with gzip.open('box.gz', 'rb') as read: data = read.read() print(data) # 文件对象的压缩与解压 # 压缩 with open('file.txt', 'rb') as read, gzip.open('file.txt.gz', 'wb') as write: shutil.copyfileobj(read, write) # 解压 with gzip.open('file.txt.gz', 'rb') as read, open('temp.txt', 'wb') as write: shutil.copyfileobj(read, write) def gzip_func(): ''' 该模块提供简单压缩和解压缩文件, 数据压缩有zlib提供 f = gzip.open(), 压缩就直接往里写, 解压就直接读取 ''' # 打开gzip压缩文件: filename:文件名或file对象, mode:读写模式,二进制: 'r', 'rb'(默认), 'a', 'ab', 'w', 'wb', 'x', 'xb',文本:'rt', 'at', 'wt', 'xt', compresslevel:压缩级别[0,9], 文本模式可提供(二进制模式不需要):encoding / errors / newline # gzip.open(filename, mode='rb', compresslevel=9, encoding=None, errors=None, newline=None) file = gzip.open("box.gz") # gzip.compress(data, compresslevel=9) // 压缩 bytes = gzip.compress(b"luzhuo.me") bytes = gzip.decompress(bytes) # 解压 if __name__ == "__main__": gzip_demo() # gzip_func() # ================================ import bz2 def bz2_demo(): # 单次压缩 bytes_com = bz2.compress(content) print("单次压缩: ", bytes_com) bytes_decom = bz2.decompress(bytes_com) print("单次解压: ", bytes_decom) # 增量压缩 bzcom = bz2.BZ2Compressor() bzdecom = bz2.BZ2Decompressor() bytes_com = bzcom.compress(content) bytes_com += bzcom.flush() print("增量压缩: ", bytes_com) bytes_decom = bzdecom.decompress(bytes_com) print("增量解压: ", bytes_decom) # 读写压缩 with open('file.txt', 'rb') as read, bz2.open('file.txt.gz', 'wb') as write: shutil.copyfileobj(read, write) with bz2.open('file.txt.gz', 'rb') as read, open('temp.txt', 'wb') as write: shutil.copyfileobj(read, write) def bz2_func(): ''' 使用bzip2压缩算法压缩和解压 该模块的所有类都是线程安全的 读取和写入压缩文件: open() BZ2File 增量压缩: BZ2Compressor BZ2Decopressor 单次压缩: compress() decompress() ''' # 读写压缩文件 # 二进制或文本模式打开bzip2压缩文件 # bz2.open(filename, mode='r', compresslevel=9, encoding=None, errors=None, newline=None) file = bz2.open("box.bz2") # 单次压缩 # bz2.compress(data, compresslevel=9) bytes_com = bz2.compress(b'luzhuo.me') # bz2.decompress(data) bytes_decom = bz2.decompress(bytes_com) # 增量压缩 # class bz2.BZ2Compressor(compresslevel=9) bzcom = bz2.BZ2Compressor() bytes_com = bzcom.compress(b'luzhuo.me') # 压缩 bytes_com = bzcom.flush() # 完成压缩, 返回剩余的压缩数据 # 增量压缩的解压缩 # class bz2.BZ2Decompressor bzdecom = bz2.BZ2Decompressor() # decompress(data, max_length=-1) // 解压 bytes_decom = bzdecom.decompress(bytes_com) boolean = bzdecom.eof # 是否到达流结束标记 if __name__ == "__main__": bz2_demo() # bz2_func() # ===================================== import lzma def lzma_demo(): # 增量压缩 lzmacom = lzma.LZMACompressor() data = lzmacom.compress(b'luzhuo') data += lzmacom.compress(b'.') data += lzmacom.compress(b'me') print("增量压缩: ", data) # 读写 with open('file.txt', 'rb') as read, lzma.open('file.txt.xz', 'wb') as write: shutil.copyfileobj(read, write) def lzma_func(): ''' LZMA压缩算法压缩和解压缩 LZMAFile线程不是安全的 ''' # 文件 # 读取:format, filters, 写入:format, check, preset, filters # lzma.open(filename, mode="rb", *, format=None, check=-1, preset=None, filters=None, encoding=None, errors=None, newline=None) f = lzma.open("box.xz") # lzma.compress(data, format=FORMAT_XZ, check=-1, preset=None, filters=None) // 压缩 bytes_com = lzma.compress(b'luzhuo.me') # lzma.decompress(data, format=FORMAT_AUTO, memlimit=None, filters=None) // 解压 bytes_decom = lzma.decompress(bytes_com) # lzma.is_check_supported(check) // 是否支持完整性检查 boolean = lzma.is_check_supported(lzma.CHECK_SHA256) # 压缩对象 check:完整性检查:CHECK_NONE,CHECK_CRC32(32位循环冗余校验),CHECK_CRC64(64位循环冗余校验),CHECK_SHA256(sha256) # preset: 压缩级别[0,9] # class lzma.LZMACompressor(format=FORMAT_XZ, check=-1, preset=None, filters=None) lzmacom = lzma.LZMACompressor() bytes_com = lzmacom.compress(b"luzhuo.me") # 压缩 bytes_com = lzmacom.flush() # 完成压缩 # 解压缩对象 # class lzma.LZMADecompressor(format=FORMAT_AUTO, memlimit=None, filters=None) lzmadecom = lzma.LZMADecompressor() # decompress(data, max_length=-1) bytes_decom = lzmadecom.decompress(bytes_com) # 解压 # 异常 try: pass except lzma.LZMAError: pass # 在压缩或解压或初始化时发生错误 if __name__ == "__main__": lzma_demo() # lzma_func() # ================================================ import zipfile def zip_demo(): # 创建压缩包 with zipfile.ZipFile(r"file.zip", "a") as write: # 往压缩包里添加文件 write.write("file.txt") # 测试压缩包 error = write.testzip() if error: print("压缩文件错误: ", error) return # 打印压缩包信息 write.printdir() write.close() # 解压压缩包 with zipfile.ZipFile(r"file.zip", "r") as read: read.extractall("temp") read.close() def zip_func(): ''' ZIP格式的压缩和解压 不支持多磁盘ZIP文件处理 可以使用ZIP64扩展(>4G的ZIP文件) 可以解密经过加密的ZIP文件,但是不能创建加密的ZIP文件 解密速度缓慢,因为是通过Python实现的 ''' # class zipfile.ZipFile // 读写的zip类 # class zipfile.ZipInfo(filename='NoName', date_time=(1980, 1, 1, 0, 0, 0)) // Zip信息 zipfile.ZIP_STORED # 存储 方法常量0 zipfile.ZIP_DEFLATED # ZIP压缩 方法常量8 zipfile.ZIP_BZIP2 # BZIP2压缩 方法常量12 zipfile.ZIP_LZMA # LZMA压缩 方法常量14 boolean = zipfile.is_zipfile(r"file.zip") # 是否是zip文件, 参数可为文件名 / 类文件对象 (测试:.rar也是zip文件) # --- class zipfile.ZipFile // 读写的zip类 --- # file:文件名 / 类文件对象, mode:r, w, a, x(创建并写入), compression:ZIP_STORED, ZIP_DEFLATED, ZIP_BZIP2, ZIP_LZMA, allowZip64:zip文件大于2G时需要使用, 支持with # class zipfile.ZipFile(file, mode='r', compression=ZIP_STORED, allowZip64=True) zipf = zipfile.ZipFile(r"file.zip") zipf.close() # 关闭压缩文件,并写入基本信息 lists = zipf.infolist() # 压缩包里每个成员文件的zipinfo对象 lists = zipf.namelist() # 压缩包里的成员文件列表 info = zipf.getinfo(lists[0]) # 获取指定成员文件的zipinfo对象 # ZipFile.open(name, mode='r', pwd=None) //打开成员文件, name:文件名 / zipinfo, pwd:密码,用于加密了的文件 f = zipf.open(lists[0]) # ZipFile.extract(member, path=None, pwd=None) // 提取成员文件, member:文件名 / zipinfo, path:提取到指定目录, 返回提取后的文件绝对路径 path = zipf.extract(lists[0]) # ZipFile.extractall(path=None, members=None, pwd=None) // 提取全部成员文件, members:提取的成员,由namelist()返回的列表子集 zipf.extractall() zipf.printdir() # 打印(sys.stdout)成员文件 zipf.setpassword("123") # 设置密码, 用于提取加密文件 # ZipFile.read(name, pwd=None) // 读取指定成员文件字节内容, 压缩文件必须以 r / a 打开 zipf.read(lists[0]) # ZipFile.write(filename, arcname=None, compress_type=None) // 追加成员文件, filename:文件名, arcname:写
                
                

-六神源码网