环境:
Python 3.6.4
pandas 0.23.4
我的代码如下.
from math import sqrt
import pandas as pd
df = pd.DataFrame({'x':[1,2,3],'y':[4,5,6]})
df = df.assign(d = lambda z: sqrt(z.x**2 + z.y**2))
最下面的一行引发TypeError,如下所示.
...
TypeError: cannot convert the series to <class 'float'>
没有sqrt,它可以工作.
df = df.assign(d2 = lambda z: z.x**2 + z.y**2)
df
Out[6]:
x y d2
0 1 4 17
1 2 5 29
2 3 6 45
并申请也有效.
df['d3'] = df.apply(lambda z: sqrt(z.x**2 + z.y**2),axis=1)
df
Out[8]:
x y d2 d3
0 1 4 17 4.123106
1 2 5 29 5.385165
2 3 6 45 6.708204
第一个怎么了?
最佳答案
使用
numpy.sqrt
-它也适用于一维数组,而来自数学的sqrt仅适用于标量:
df = df.assign(d = lambda z: np.sqrt(z.x**2 + z.y**2))
另一个解决方案是使用**(1/2):
df = df.assign(d = lambda z: (z.x**2 + z.y**2)**(1/2))
print (df)
x y d
0 1 4 4.123106
1 2 5 5.385165
2 3 6 6.708204
您的解决方案可以正常工作,因为轴= 1在应用中按标量进行工作,但是像提到的@jpp一样,应用不应被首选,因为它涉及Python级的逐行循环.
df.apply(lambda z: print(z.x),axis=1)
1
2
3