我正在尝试将数据从csv加载到我的postgres数据库中。我正在使用sqlalchemy(以及连接/原始sql数据方法而不是ORM方法)。但是,我成功创建了具有相应字段的表。使用复制时,什么也不会发生:我没有收到错误,但我的表也为空。
conn = eng.connect()
trans = conn.begin()
try:
conn.execute("""CREATE TABLE IF NOT EXISTS table_name(var1 numeric, date date, time time, datetime timestamp primary key,....);""")
trans.commit()
except:
trans.rollback()
raise
try:
# File 1 bid
conn.execute("""COPY table_name FROM '/home/user/csvfile.csv'
WITH CSV HEADER DELIMITER as ','""")
trans.commit()
except:
trans.rollback()
raise
Jupyter笔记本没有报告任何错误消息。
我究竟做错了什么?
此外,我不太了解:
file = "/home/user/csvfile.csv"
conn.execute("""COPY table_name FROM file
WITH CSV HEADER DELIMITER as ','""")
在“文件”中产生错误。
交易不可重用:
>>> trans = conn.begin()
2018-03-29 09:14:33,001 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
>>> trans.commit()
2018-03-29 09:14:35,449 INFO sqlalchemy.engine.base.Engine COMMIT
>>> trans.commit()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/u/sqlalchemy/lib/sqlalchemy/engine/base.py", line 1642, in commit
raise exc.InvalidRequestError("This transaction is inactive")
sqlalchemy.exc.InvalidRequestError: This transaction is inactive
>>> trans.rollback()
>>>
您必须在第一笔交易之后开始新的交易,或在同一笔交易中执行所有操作。
另一方面,这不能解释为什么COPY失败。在先前的显式事务结束之后,连接将退回到自动提交。换句话说,如果没有事务在进行中,则引擎或连接将提交。但是这里有个问题:自动提交基于检测数据更改操作,这是通过将给定语句与
AUTOCOMMIT_REGEXP = re.compile(
r'\s*(?:UPDATE|INSERT|CREATE|DELETE|DROP|ALTER|GRANT|REVOKE|'
'IMPORT FOREIGN SCHEMA|REFRESH MATERIALIZED VIEW|TRUNCATE)',
re.I | re.UNICODE)
您可能会注意到,COPY不是该正则表达式的一部分。如前所述,您最好的选择是开始另一个显式事务,或在同一事务中执行两个动作。但是,如果您希望将来与COPY一起使用自动提交,请指示SQLAlchemy应该自动提交:
conn.execute(text("COPY ...").execution_options(autocommit=True))
至于后一种错误,FROM file
不是神奇地访问Python变量,而是一种语法错误。将文件名作为参数传递给查询:
copy_stmt = text("COPY table_name FROM :file WITH CSV HEADER")
copy_stmt = copy_stmt.execution_options(autocommit=True)
conn.execute(copy_stmt, {"file": file})
请注意,从文件复制需要某些您可能不应该拥有的特权:
仅允许数据库超级用户使用COPY命名文件或命令,因为它允许读取或写入服务器有权访问的任何文件。
解决方案是使用COPY ... FROM STDIN
,但要使用该解决方案,您必须使用原始DB-API连接:
file = "/home/user/csvfile.csv"
stmt = "COPY table_name FROM STDIN CSV HEADER"
raw_conn = eng.raw_connection()
# Uses the actual psycopg2 connection as a context manager
# for transaction handling.
with open(file) as f, \
raw_conn.connection, \
raw_conn.cursor() as cur:
cur.copy_expert(stmt, f)
raw_conn.close()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句