Pandas中的八个常用option设置,能够提高我们在数据处理中的效率,下面是对它们的详解:
1. display.max_rows
这个选项控制了DataFrame或Series在notebook或控制台中显示的最大行数。
例如,我们可以通过下面的代码将DataFrame在notebook中显示的最大行数设置为20:
import pandas as pd
pd.options.display.max_rows = 20
2. display.max_columns
与display.max_rows类似,这个选项控制了DataFrame或Series在notebook或控制台中显示的最大列数。
例如,我们可以通过下面的代码将DataFrame在notebook中显示的最大列数设置为20:
import pandas as pd
pd.options.display.max_columns = 20
3. display.expand_frame_repr
这个选项控制了DataFrame是否以展开形式(未折叠/滚动显示)的方式在控制台中显示。
例如,我们可以通过下面的代码将DataFrame在控制台中以折叠形式显示:
import pandas as pd
pd.options.display.expand_frame_repr = False
4. display.precision
这个选项控制了浮点数在DataFrame或Series中的显示精度。
例如,我们可以通过下面的代码将DataFrame或Series中浮点数的显示精度设置为4:
import pandas as pd
pd.options.display.precision = 4
5. display.max_colwidth
这个选项控制了DataFrame或Series中单元格的最大宽度。
例如,我们可以通过下面的代码将DataFrame或Series中单元格的最大宽度设置为50:
import pandas as pd
pd.options.display.max_colwidth = 50
6. display.large_repr
这个选项控制了当DataFrame或Series的行数超过display.max_rows,列数超过display.max_columns时,控制台的显示方式。
例如,我们可以通过下面的代码将DataFrame或Series在超过max_rows或max_columns时以摘要形式显示:
import pandas as pd
pd.options.display.large_repr = 'info'
7. mode.use_inf_as_na
这个选项控制了是否将Inf(无穷大)或NaN视为缺失值。
例如,我们可以通过下面的代码将Inf或NaN视为缺失值:
import pandas as pd
pd.options.mode.use_inf_as_na = True
8. mode.chained_assignment
这个选项控制了关于DataFrame中列的警告,当我们对DataFrame进行修改时可能会出现这些警告。
例如,我们可以通过下面的代码禁用警告:
import pandas as pd
pd.options.mode.chained_assignment = None
以上就是Pandas中八个常用option设置的示例详解。通过合理地使用它们,我们能够更加高效地处理数据。