目录
- 前言
- 最近接到一个需求,就是将多个Eccel文件(表头相同;每个都非常大,约60多万行,每个都是!!)先合并在一起,再做一些处理,但是Excel表格一个文件根本存不下这么多!更别提打开再做处理,怎么办?当然是借助Mysql啦,利用Python脚本将每一个文件内容插入进去,(其实也可以单个依次导入,但是有多个Excel文件,这样比较繁琐。更重要的是我会Python直接写个脚本)
- 图片展示
- 1、先创建数据库
- 2、目录结构展示
- 3、奉上所有代码和注释
- 4、注意事项
- 4-1
- 数据库端口号我的是33061,一般来说是 3306
- 4-2
- 切记,有多少个(列)表头,就有多少个 %s 占位符
- 希望对大家有帮助
- 致力于办公自动化的小小程序员一枚
- 致力于写出清楚的博客
- 都看到这了,关注+点赞+收藏=不迷路!!
前言
最近接到一个需求,就是将多个Eccel文件(表头相同;每个都非常大,约60多万行,每个都是!!)先合并在一起,再做一些处理,但是Excel表格一个文件根本存不下这么多!更别提打开再做处理,怎么办?当然是借助Mysql啦,利用Python脚本将每一个文件内容插入进去,(其实也可以单个依次导入,但是有多个Excel文件,这样比较繁琐。更重要的是我会Python直接写个脚本)
图片展示
**↓**
1、先创建数据库
2、目录结构展示
文件夹:数据源:用来存放Excel文件
3、奉上所有代码和注释
import osimport timeimport pandas as pdimport pymysqlt1 = time.time()# 连接mysqlconnect = pymysql.connect(host='localhost', # 本地数据库 user='root',# 用户名 password=自己的数据库连接密码, # 数据库密码 db=自己的数据库名称, # 数据库名称 port=3306, # 数据库端口号 charset='utf8') #服务器名,账户,密码,数据库名称cur = connect.cursor()sql2 = 'truncate table 插入测试表;' # 每次插入前先清空表cur.execute(sql2)#for f in os.listdir("./数据源/"):# 读取 f_n = "./数据源/"+f df = pd.read_excel(f_n,sheet_name=0,keep_default_na="",dtype=str) data = df.values.tolist() for i in data: # print(i) sql = 'insert into 插入测试表 values (%s,%s,%s,%s);'# 切记,有多少个(列)表头,就有多少个 %s 占位符 cur.execute(sql,tuple(i)) print(f,"插入成功")connect.commit()print("ok")# 关闭数据库cur.close() # 关闭游标connect.close() # 关闭数据库连接t2 = time.time()print("数据插入结束,用时%.2f秒"%(t2-t1))
4、注意事项
4-1
数据库端口号我的是33061,一般来说是 3306
4-2
切记,有多少个(列)表头,就有多少个 %s 占位符