1.判断两个大文件是否是同一个文件
import os import hashlib import time start = time.time() path1 = r"E:\视频资料\elk\1.zip" path2 = r"E:\视频资料\elk\2.zip" def file_hash(path): file_size = os.path.getsize(path) md5 = hashlib.md5() with open(path1,'rb') as info: while file_size >=8192: content = info.read(8192) md5.update(content) file_size -=8192 else: content = info.read(file_size) if content: md5.update(content) return md5.hexdigest() # def file_hash(path): # md5 = hashlib.md5() # with open(path1, 'rb') as info: # md5.update(info.read()) # return md5.hexdigest() def file(path1,path2): return file_hash(path1) ==file_hash(path2) ret = file(path1,path2) print(ret) end =time.time() print(end-start)
通过制定读取大小计算和直接读取计算的hash是一样的,但是使用时间会有所不同,直接将文件全部读入到内容中会占用时间更长,cpu使用率在一定时间内会飙升!
上面代码刚开始不懂得是:按照指定大写获取到的hash和直接读取到的hash的是一样的么?通过验证确定一样的
#以下两种犯法获取到的"helloworld"的hash是一样的 md5 = hashlib.md5() md5.update(b'hello') md5.update(b'world') ret = md5.hexdigest() print(ret) md5 = hashlib.md5() md5.update(b'helloworld') ret = md5.hexdigest() print(ret)
2.python处理大文件
def func(): with open('t','r',encoding='utf-8')as f: for i in f: i = i.strip('\r\n') yield i g = func() for i in g: try: print(i) except StopIteration: # pass print(1)
3.模拟微信红包
import random def red_pac(money,num): ret = random.sample(range(1,money*100),num-1) #取出9个点,乘以100 是考虑小数的情况 ret.sort() #将结果从大到小排序 ret.insert(0,0) #为什么将0和100放进去刚开始没想明白,后来发现加上sample的中是分成了9分,加上最小值0和最大值100之后是11个 #11个数之间两两相减就是10个红包的金额, #因为sample是取一个范围之间的不重复数字,所以每个人的概率也是一样的 ret.append(money*100) for i in range(len(ret)-1): value = ret[i+1] - ret[i] #算出相邻节点之间的差,就是红包的金额,ret后一个减去前一个数字加起来除以100正好是100 yield value/100 g = red_pac(100,10) #发100块钱,发10个红包 for i in g: print(i)
4.三级菜单
china_ditie = { "北京": { "一号线": ["四惠", "大望路", "天安门", "西单"], "二号线": ["北京站", "朝阳门", "东直门", "西直门"], "三号线": ["国贸", "三元桥", "知春路", "巴沟"] }, "上海": { "四号线": ["徐家汇", "人民广场", "延长路", "共康路", "呼兰路"], "五号线": ["东昌路", "静安寺", "江苏路", "虹桥火车站"], "六号线": ["宝山路", "赤峰路", "曹阳路", "虹桥路", "宜山路"] }, "广州": { "七号线": ["东山口", "农讲所", "烈士陵园", "公园前", "体育西路"], "八号线": ["黄边", "纪念堂", "三元里", "白云公园"], "九号线": ["沙河顶", "北京路", "一德路", "文化公园"] }, "深圳": { "一号线": ["高新园", "桃园", "白石洲", "华侨城"], "四号线": ["白石龙", "明乐", "少年宫", "红山"], "五号线": ["大学城", "兴东", "西里", "深圳北站"] }, }
for item in china_ditie: #取出整个字典中的key,然后循环 print(item) key1 = input('>>>') #接收的是循环出来的key,然后循环这个key所对应的值 for item1 in china_ditie[key1]: print(item1) key2 = input('>>>') for item2 in china_ditie[key1][key2]: print(item2) #字典有几层,就应该有几个for循环
l = [china_ditie] while l: for item in l[-1]: print(item) name = input(">>>") if name.upper() == "Q": l.clear() elif name.upper() == "B": l.pop() else: if l[-1].get(name): l.append(l[-1][name]) ''' 这个解法是使用列表的pop()方法和append()方法,实现了一个简单的栈操作 将字典添加到列表里面,通过l[-1]取出字典,并将其键打印到屏幕上,通过用户输入的来判断 是否是屏幕上打印的出来的字符串,如果不是就让用户重新输入,如果是的话 就验证l[-1]中原始的字典中是否有这个键,如果有这个键,就将这个键所对应的二层字典加入到l列表中,这样l列表就有 两个以字典为元素的值了。在通过while循环取出l[-1]元素,就是我们刚刚添加进去的二层字典进行显示 如果输出b则返回上一层,就删除l[-1]这个列表中最后面的字典。就能显示其上一层。 主要是用列表的方法实现了后进先出的特点,当显示到最后n层的时候,列表里面就会有n个以字典为元素的值 '''
5.计算文件夹大小
import os def get_zise(path): li = [path] file_size = 0 while li: path = li.pop() dirs = os.listdir(path) for item in dirs: path_dir = os.path.join(path,item) if os.path.isfile(path_dir): file_size +=os.path.getsize(path_dir) else: li.append(path_dir) return file_size ret = get_zise(r'E:\oldboy\python 20\讲课\day01') print(ret)
6.python编写计算器
#^尖括号在[]里面表示非 def chengchu(res): if '*' in res: a,b = res.split('*') return str(float(a)*float(b)) else: a, b = res.split('/') return str(float(a) / float(b)) import re exp = '1 - 2 * ( (60-30 + (9-2*5/3 + 7 /3*99/4*2998 +10 * 568/14 )*(-40/5)) - (-4*3)/ (16-3*2) )' exp =exp.replace(" ",'') def format_exp(exp): ''' 完成表达式格式整理,将一些叠在一起的符号整理成一个符号 :param exp: str数据类型的表达式 '1.23++3+-4--5' :return: 整理之后的str数据类型的字符串,'1.23+3-4+5' ''' exp = exp.replace('++','+') exp = exp.replace('-+','-') exp = exp.replace('+-','-') exp = exp.replace('--','+') return exp ''' #匹配出扩号最里面的表达式,(9-2*5/3+7/3*99/4*2998+10*568/14) ''' ret = re.search('\([^()]+\)', exp) #(9-2*5/3+7/3*99/4*2998+10*568/14) ret5 = ret.group() while True: ''' \d+(\.\d+)?[*/]-?\d+(\.\d+)? \d+(\.\d+)?:匹配整数和小数,小数出现0次或1次 [*/]:匹配乘法和除法 -?\d+(\.\d+)?:匹配负数和负小数 ''' ret1 = re.search('\d+(\.\d+)?[*/]-?\d+(\.\d+)?',ret5) #列出每一个乘除式子 2*5 if ret1: ret2 = chengchu(ret1.group()) #计算每一个乘除10 ret5 =ret5.replace(ret1.group(),ret2) no_bracket_exp = format_exp(ret5) # 再计算加减法 res_lst = re.findall('[-+]?\d+(?:\.\d+)?', no_bracket_exp) sum_n = 0 for i in res_lst: sum_n += float(i) print (sum_n) else: break #有的时候,往往取不到变量的名字 #通过变量的字符串的名字,可以通过反射获取
返回系列