Pandas—to_csv()写入函数参数详解
1. to_csv函数的参数
DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict')
2. 参数解释
参数名 |
参数类型 |
描述 |
path_or_buf |
字符串或文件句柄 |
默认无文件路径或对象,如果没有提供,结果将返回为字符串。 |
sep |
默认字符‘,’ |
输出文件的字段分隔符。 |
na_rep |
字符串,默认为 ‘’ |
缺失数据填充。 |
float_format |
字符串,默认为 None |
小数点保留几位。 |
columns |
序列,数组 |
可选列写入,要写入的字段列表。 |
header |
字符串或布尔列表,默认为true |
写出列名。如果给定字符串列表,则作为列名的别名。 |
index |
布尔值,默认为Ture |
写入行名称(索引)。 |
index_label |
字符串或序列,或False,默认为None |
如果需要,可以使用索引列的列标签。如果没有给出,且标题和索引为True,则使用索引名称。如果数据文件使用多索引,则应该使用这个序列。如果值为False,不打印索引字段。在R中使用index_label=False 更容易导入索引. |
mode |
字符串,默认为"w" |
Python写模式,默认“w”。 r : 只能读, 必须存在, 可在任意位置读取 w : 只能写, 可以不存在, 必会擦掉原有内容从头写 a : 只能写, 可以不存在, 必不能修改原有内容, 只能在结尾追加写, 文件指针无效 r+ : 可读可写, 必须存在, 可在任意位置读写, 读与写共用同一个指针 w+ : 可读可写, 可以不存在, 必会擦掉原有内容从头写 a+ : 可读可写, 可以不存在, 必不能修改原有内容, 只能在结尾追加写, 文件指针只对读有效 (写操作会将文件指针移动到文件尾) |
encoding |
字符串,可选 |
编码格式,表示在输出文件中使用的编码的字符串,Python2默认为“ASCII”,Python3默认为“UTF-8”。 |
compression |
字符串,可选项 |
表示在输出文件中使用的压缩的字符串,允许值为“gzip”、“bz2”、“xz”,仅在第一个参数是文件名时使用。 |
line_terminator |
字符串,默认为 ‘\n’ |
在输出文件中使用的换行字符或字符序列。默认为os.linesep,这取决于调用此方法的操作系统(例如,对于linux为“n”,对于Windows为“rn”) |
quoting |
CSV模块的可选常量 |
默认值为to_csv.QUOTE_MINIMAL。如果设置了浮点格式,那么浮点将转换为字符串,因此csv.QUOTE_NONNUMERIC会将它们视为非数值的。 |
quotechar |
字符串(长度为1),默认“” |
用于引用字段的字符 |
doublequote |
布尔,默认为Ture |
引用路径在双引号内 |
escapechar |
字符串(长度为1),默认为None |
在适当的时候用来转义sep和quotechar的字符 |
chunksize |
int或None |
一次写入行 |
date_format |
字符串,默认为None |
日期时间对象的格式字符串 |
decimal |
字符串,默认’。’ |
识别为十进制分隔符的字符。欧洲数据使用 ??’,’ |
errors |
字符串。 |
指定如何处理编码和解码错误 |