Python Pandas to_csv函数

`pandas` 库中的 `to_csv()` 方法用于将数据保存到 CSV(逗号分隔值)文件中。它是 `DataFrame` 对象的一个方法,可以将数据框中的内容写入到指定的文件中。

使用语法如下

DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.')

其中一些常用参数说明如下:

– `path_or_buf`:保存文件的路径或文件对象。如果不指定该参数,则返回一个表示 CSV 格式的字符串。
– `sep`:字段之间的分隔符,默认为逗号。
– `na_rep`:缺失值的表示,默认为空字符串。
– `columns`:要写入文件的列,默认为所有列。
– `header`:是否将列名写入文件,默认为 True。
– `index`:是否将索引写入文件,默认为 True。
– `mode`:打开文件的模式,{‘w’, ‘x’, ‘a’},默认为 `’w’`(覆盖写入)。

`w`:以写模式打开文件。如果文件已经存在,则会覆盖原有内容;如果文件不存在,则会创建一个新文件。

`a`:以追加模式打开文件。如果文件已经存在,则会在文件末尾追加内容;如果文件不存在,则会创建一个新文件。

`x`:以创建模式打开文件。如果文件已经存在,则会抛出一个`FileExistsError`异常;如果文件不存在,则会创建一个新文件。

– `encoding`:文件编码,默认为 None,表示使用系统默认编码。
– `quoting`:引号的控制方式,默认为引用所有非数字字段,也可以设置为 `csv.QUOTE_NONE`(不引用任何字段)或 `csv.QUOTE_NONNUMERIC`(只引用非数字字段)。
– `line_terminator`:行终止符,默认为 `’\n’`。
– `date_format`:日期格式化字符串,用于将日期时间类型转换为字符串。

下面是一个示例,将一个 `DataFrame` 对象保存为 CSV 文件:

import pandas as pd# 创建示例 DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],'Age': [25, 30, 35],'City': ['New York', 'London', 'Paris']}df = pd.DataFrame(data)# 保存为 CSV 文件df.to_csv('data.csv', index=False)

上述代码将创建一个名为 `data.csv` 的文件,并将数据框 `df` 写入到该文件中。`index=False` 参数表示不将索引写入文件。

你也可以将 `path_or_buf` 参数设为 `None`,将数据保存为一个字符串:

csv_string = df.to_csv(index=False)print(csv_string)

上述代码将把 `df` 中的数据保存为一个 CSV 格式的字符串,并打印出来。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享