我试图使用xlrd从Excel文件中读取值.它在日期,数字以及迄今为止的文本方面都做得很好.我有一个列(类别),其中包含包含文本的单元格(单元格格式为文本).当我打印出单元格值时,会显示一个浮点数而不是文本.我还打印出要检查的Cell对象的ctype,它显示为Number.我已经阅读了xlrd的文档和教程,似乎无法找到原因.可能是因为我的excel文件被搞砸了?有正确方向的建议或指示吗?
import xlrd
import datetime
workbook = xlrd.open_workbook('training.xls')
courseSheet = workbook.sheet_by_index(0)
for row in range(courseSheet.nrows):
title = courseSheet.cell_value(row,2)
date = courseSheet.cell_value(row,4)
date = datetime.datetime(*xlrd.xldate_as_tuple(date,workbook.datemode))
dateTuple = date.timetuple()
category = courseSheet.cell_value(row,7)
print category
最佳答案
背景:对于每个单元格,xlrd报告存储在XLS文件中的内在值(如果有).最初仅根据文件中的记录类型分配值类型(例如,NUMBER和RK记录包含浮点数).它按照here所述对格式进行分类,并使用该信息覆盖显示日期时间,日期或时间而非数字的值类型. xlrd并不意味着能够根据归属于单元格的格式呈现单元格值.
有问题的细胞显然是作为数字输入的.如果他们已经应用了文本格式,那么这不会使他们成为“文本单元格”.
你说“”当我打印出单元格值时会显示一个浮点而不是文本“”“…请举例说明(a)创建文件时输入到单元格中的内容(b)什么是“细胞被格式化为文本”的证据(c)什么是repr(cell.value)(d)你期望显示的“文本”是什么?
您可能会发现以下代码有用:
import xlrd,sys
def dump_cell(sheet,rowx,colx):
c = sheet.cell(rowx,colx)
xf = sheet.book.xf_list[c.xf_index]
fmt_obj = sheet.book.format_map[xf.format_key]
print rowx,colx,repr(c.value),c.ctype,\
fmt_obj.type,fmt_obj.format_key,fmt_obj.format_str
book = xlrd.open_workbook(sys.argv[1],formatting_info=1)
sheet = book.sheet_by_index(0)
for rowx in xrange(sheet.nrows):
for colx in xrange(sheet.ncols):
dump_cell(sheet,colx)