我有一个巨大的DataFrame,其中一些列具有相同的名称.当我尝试选择存在两次的列时(例如del df [‘col name’]或df2 = df [‘col name’]),我得到一个错误.我能做什么?
解决方法
您可以按索引对列列出:
>>> df = pd.DataFrame([[1,2],[3,4],[5,6]],columns=['a','a']) >>> df a a 0 1 2 1 3 4 2 5 6 >>> df.iloc[:,0] 0 1 1 3 2 5
或者您可以重命名列,例如
>>> df.columns = ['a','b'] >>> df a b 0 1 2 1 3 4 2 5 6