我正在尝试做一个pandas merge并在我尝试运行时从标题中获得上述错误.我使用3列匹配,而在我仅在2列上进行类似合并之前它工作正常.
df = pd.merge(df, c, how="left",
left_on=["section_term_ps_id", "section_school_id", "state"],
right_on=["term_ps_id", "term_school_id", "state"])
Run Code Online (Sandbox Code Playgroud)
两个数据帧的列
DF:
索引([u'section_ps_id',u'section_school_id',u'section_course_number',u'secti on_term_ps_id',u'section_staff_ps_id',u'section_number',u'section_expression',u'section_grade_level',u'state',u 'sections_id',u'course_ps_id',u'course_sc hool_id',u'course_number',u'course_schd_dept',u'courses_id',u'school_ps_id',u'course_school_id',u'school_name',u'school_abbr', u'school_low_grade',u'sch ool_high_grade',u'school_alt_school_number',u'school_state',u'school_phone',u'school_fax',u'school_principal',u'school_principal_phone',u'school_principa l_email',u'school_asst_principal ',u'school_asst_principal_phone',u'school_ass t_principal_email'],dtype ='object')
C:
索引([u'term_ps_id',u'term_school_id',u'term_portion',u'term_start_date',u'term_end_date',u'term_abbreviation',u'term_name',u'state',u'terms_id',u' sch ool_ps_id',u'term_school_id',u'school_name',u'school_abbr',u'school_low_grad e',u'school_high_grade',u'school_alt_school_number',u'school_state',u'school _phone',u'school_fax' ,u'school_principal',u'school_principal_phone',u'school _principal_email',u'school_asst_principal',u'school_asst_principal_phone',你的chool_asst_principal_email'],dtype ='object')
是否可以像这样合并三列?这里的合并电话有什么问题吗?
我有一个通过read_csv加载的pandas数据帧,当我尝试时,我试图通过to_sql将数据库推送到数据库
df.to_sql("assessmentinfo_pivot", util.ENGINE)
Run Code Online (Sandbox Code Playgroud)
我找回了unicodeDecodeError:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 83-84: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
to_sql没有编码选项来为to_sql指定utf-8,并且创建的Engine的编码设置为utf-8
ENGINE = create_engine("mssql+pymssql://" +
config.get_local('CEDS_USERNAME') + ':' +
config.get_local('CEDS_PASSWORD') + '@' +
config.get_local('CEDS_SERVER') + '/' +
config.get_local('CEDS_DATABASE'),
encoding="utf-8")
Run Code Online (Sandbox Code Playgroud)
任何大熊猫都能深入了解如何正常工作?我搜索的大部分内容都是让我遇到to_csv类似错误的人,这只是通过添加encoding ="utf-8"来解决,但遗憾的是这里不是一个选项.
我尝试将文件削减,但即使被剥离到标题,它仍然会出错:http://pastebin.com/F362xGyP
我试图在pandas数据帧上使用过滤器来过滤掉与重复值匹配的所有行(当存在重复时需要删除所有行,而不仅仅是第一个或最后一个).
这就是我在编辑器中的作用:
df = df.groupby("student_id").filter(lambda x: x.count() == 1)
Run Code Online (Sandbox Code Playgroud)
但是,当我使用此代码运行我的脚本时,我收到错误:
TypeError:filter函数返回一个Series,但是期望一个标量bool
我在尝试应用过滤器之前,通过连接另外两个帧来创建数据帧.
我有一个项目设置为与 docker 一起运行 一台机器是 ubuntu 我一直在运行它,但最近我试图在我的 Windows 笔记本电脑上运行它,但遇到了 ModuleNotFoundError。
[2018-01-05 20:31:46 +0000] [5] [INFO] Starting gunicorn 19.7.1
explore_1 | [2018-01-05 20:31:46 +0000] [5] [INFO] Listening at: http://0.0.0.0:8080 (5)
explore_1 | [2018-01-05 20:31:46 +0000] [5] [INFO] Using worker: sync
explore_1 | [2018-01-05 20:31:46 +0000] [8] [INFO] Booting worker with pid: 8
explore_1 | [2018-01-05 20:31:46 +0000] [8] [ERROR] Exception in worker process
explore_1 | Traceback (most recent call last):
explore_1 | File "/usr/local/lib/python3.6/site-packages/gunicorn/arbiter.py", line 578, in spawn_worker
explore_1 | worker.init_process()
explore_1 …
Run Code Online (Sandbox Code Playgroud) 在哪些情况下,java 的 System.out.println 将无法产生任何输出。我在一个方法内部调用了它,有时在调用该方法时我得到了 println ,而有时我没有。
更新:我也在 println 之后使用 System.out.flush()。
更新:感谢您的调试帮助。结果发现,打开对话框的阻塞调用使输出显示的顺序大大不正确。我以为我试图打印消息的方法在对话框关闭时被调用,但方法本身就是调用对话框的方法,所以在关闭之后它已经超过了打印输出,这是我开始寻找测试的地方。如果有人有能力删除此问题,因为问题不是最初提出的问题,我们将不胜感激。
找不到库 geos_c 或加载其任何变体 ['libgeos_c.so.1', 'libgeos_c.so']
使用 python:3.5.1 图像我试图运行一个容器,其中包括它安装在 requirements.txt 中的其他内容。当 docker 容器尝试安装匀称时,我收到上述错误。
运行 apt-get install libgeos-dev
是我在尝试搜索问题时看到的,但返回无法找到包 libgeos-dev
概括:
预期条件:在 requirements.txt 文件中包含 shapely 导致在构建 docker 容器时安装 shapely 实际条件:构建期间收到错误消息 Could not find library geos_c or load any of its variants ['libgeos_c.so.1', 'libgeos_c.so']
重现步骤:
使用 docker-compose 构建
Docker-compose.yml:
app:
build: ${APP_REPO}
Run Code Online (Sandbox Code Playgroud)
Dockerfile:
FROM python:3.5.1-onbuild
Run Code Online (Sandbox Code Playgroud)
要求.txt:
shapely
Run Code Online (Sandbox Code Playgroud)
(简化为尝试隔离问题。)
我正在从excel工作簿中将数据加载到pandas数据框中,并在我收到上述错误时尝试将其推送到数据库.
我一开始认为数据库的整理是有问题的,我改为utf8_bin
接下来,我检查了我的数据库引擎创建语句,我也为编码添加了一个参数.
engine = create_engine('mysql+pymysql://root@localhost/test', encoding="utf-8")
Run Code Online (Sandbox Code Playgroud)
但这些都不起作用我仍然从行中得到错误:
df.to_sql("strand", engine, if_exists="append", index=False)
Run Code Online (Sandbox Code Playgroud)
我检查了to_sql方法是否有编码参数,但似乎并非如此.