这段循环逻辑有问题, 因为最后的2行代码都在循环体里面,这导致了每次to_csv只导出一条数据。最后程序运行完之后,csv文件里的最终结果只是最后一条数据而已。
而且这段程序过于繁杂了,有很多多余的计算,当数据多的时候会有性能问题。可以用下面的方法, 要更简洁。
# 直接把profile(也就是result字段里的内容)放进DataFrame参数里面
# 然后在把需要的字段过滤一下, 这样就可以1行代码解决你的问题了,当然下面的为了让代码更易读,我分成了3行。
profile = responer.json()(['content']['positionTrsult']['result'])
profileColumns = ['positionName', 'city', 'education', 'workYear']
f = pd.DataFrame(profile, columns=profileColumns )
#pandas在很多操作的时候,能得到我们想象中的结果,所以多试试,会有很多惊喜的~
然后看你是刚用pandas(我也是刚学习pandas),给你一个建议, 就是涉及到pandas的操作就【尽量】不要用循环,这对以后处理大量数据的时候会产生非常大的性能问题的。我用循环处理10W+的数据的时候等了十分钟都没有得出结果来。。。CPU是8700k,内存32G都不行...