我试图通过csv文件中的python脚本读取大数据(数千行),如下所示:
.....
2015-11-03 20:16:28,000;63,62;
2015-11-03 20:16:29,75;
2015-11-03 20:16:30,86;
2015-11-03 20:16:31,000;64,25;
但似乎其中一个文件有额外的空行,有196541465个空格 – 然后当用pandas lib的read_csv读取它时代码崩溃了.
File "/usr/lib/python2.7/dist-packages/pandas/core/frame.py",line 4221,in append
elif isinstance(other,list) and not isinstance(other[0],DataFrame):
IndexError: list index out of range
我正在使用以下命令:
data = pd.read_csv(input_file,skiprows = [0],usecols=[0,1,2],delimiter=';',decimal=',',names = [ 'date','angle','Unnamed'],na_filter = False,parse_dates = [0],date_parser = reformat_date,error_bad_lines = False,skip_blank_lines=True)#,nrows = 8191)
罪魁祸首行是8192′,当限制行(按行= 8191)时,它的工作正常.我已尝试过doc中的许多选项,但它似乎不起作用!任何的想法?
最佳答案