我发现自己经常使用Python的解释器来处理数据库,文件等 - 基本上是大量的半结构化数据的手动格式化.我没有像我希望的那样经常保存和清理有用的位.有没有办法将我的输入保存到shell中(数据库连接,变量赋值,少量循环和逻辑位) - 交互式会话的一些历史记录?如果我使用像script我得到太多stdout噪音的东西.我真的不需要腌制所有对象 - 但如果有一个解决方案可以做到这一点,那就没关系.理想情况下,我只剩下一个脚本,它以我交互式创建的脚本运行,我可以删除我不需要的位.有没有这样做的包,或DIY方法?
更新:我对这些包的质量和实用性感到非常惊讶.对于那些有类似痒的人:
我被转换了,这些真正填补了翻译和编辑之间的需要.
我有详细的美国县地图,来自TIGER LINE数据集.我如何对数据进行采样,平滑或降级,以便我得到更直,更宽松,更少"嘈杂"的形状来表示地理特征 - 在这种情况下只是县界和州界线,但也可能在一般情况下?
如果可以有效地完成采样,则可以在渲染时发生采样,或者可以生成并存储并行数据集.我正在使用PostGIS,并且这些线是由shp2pgsql- 生成的多折线- 但是任何解决方案都是非常有用的,你可以采用波浪线并将其缩小到与人类解释器大致相同的平滑线.
我想知道如何设置vim为新的html5元素(即"画布"和"视频")着色,就像现有的"脚本","body"元素(或其他语言中的保留字,如python的"def")当前版本来自通常用于终端仿真器的MacPorts.
我有一个数据块,目前作为n元组的列表,但格式非常灵活,我想附加到Postgres表 - 在这种情况下,每个n元组对应于DB中的一行.
到目前为止我一直在做的是将这些全部写入CSV文件,然后使用postgres的COPY将所有这些内容加载到数据库中.这是有效的,但是不是最理想的,我更愿意直接从python中完成这一切.在python中是否有一种方法可以在Postgres中复制COPY类型的批量加载?
我有一个使用mod_python的django应用程序,相当典型的配置,除了媒体文件由文档根目录中的(我知道,不推荐)'media'目录提供服务.我想测试并使用mod_wsgi进行部署,但我无法弄清楚如何创建简单的服务静态文件.mod_python允许使用Apache指令,如:
<Location '/'>
SetHandler MyApplication.xyz.....
</Location>
<Location '/media'>
SetHandler None
</Location>
Run Code Online (Sandbox Code Playgroud)
django文档似乎指向上面的第二个块作为为mod_wsgi制作类似异常的正确方法,但在我的测试中,根目录下的所有内容仍然被发送到wsgi应用程序.是否有一个很好的方法用mod_wsgi设置一个静态媒体目录,或者我是否因为技术原因而故意不支持?欢迎指出完全不同的方法的答案.
我正在将数据库从mysql迁移到postgresql.mysql db的默认排序规则是UTF8,postgres也使用UTF8,我用pg_escape_string()编码数据.无论出于何种原因,我遇到了一些关于错误编码的时髦错误:
pg_query() [function.pg-query]: Query failed: ERROR: invalid byte sequence for encoding "UTF8": 0xeb7374
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client"
我一直在试图解决这个问题,并注意到php正在做一些奇怪的事情; 如果一个字符串中只包含ascii字符(例如"hello"),则编码为ASCII.如果字符串包含任何非ascii字符,则表示编码为UTF8(例如"Hëllo").
当我在已经是UTF8的字符串上使用utf8_encode()时,它会杀死特殊字符并使它们全部混乱,所以......我能做些什么才能使它工作?
(现在把它挂起的确切字符是" ",但不是只搜索/替换,我想找到一个更好的解决方案,所以这个问题不再发生)
除了Google提供的Google App Engine文档之外,是否有任何人可以获得任何有用的信息,这些文档可以为具有MS SQL背景的人提供良好的概述,以便有效地移植他们的知识并使用Google App Engine数据存储API.
例如,如果您有自己创建的用户表和消息表
如果用户和消息之间存在关联(通过UserID连接),那么在Google App Engine中如何表示此结构?
SELECT * FROM Users INNER JOIN Message ON Users.ID = Message.UserID
Run Code Online (Sandbox Code Playgroud) 所以我想在Docuement级别的Excel VSTO插件中捕获一些关键命令.我似乎无法找到一种方法来做到这一点,除了使用VBA并让我们的插件与VBA交谈.任何帮助/示例将不胜感激.
我正在使用Excel 2007.
有没有人建议在哪里可以找到用于小型语料库的档案或日常英语文本集合?我一直在使用古腾堡项目的书籍作为工作原型,并希望融入更多现代语言.一个最近的答案在此间接指出了一个伟大的新闻组电影评论归档,这对我没有发生,而且非常好.对于这个特定的程序,技术usenet档案或编程邮件列表会使结果倾斜并且难以分析,但任何类型的一般博客文本,聊天记录或任何可能对其他人有用的东西都会非常有用.此外,非常感谢部分或可下载的研究语料库,其中没有太多标记,或者用于查找维基百科文章的适当子集或任何其他想法的一些启发式.
(顺便说一句,我是一个很好的公民,没有下载,使用一个故意慢的脚本,对托管这种材料的服务器没有要求,以防你认为道德风险指向我巨大的东西.)
更新:用户S0rin指出维基百科请求不爬行,而是提供此导出工具.Project Gutenberg 在这里指定了一个策略,底线,尽量不要抓取,但是如果你需要:"配置你的机器人在请求之间至少等待2秒."
更新2 维基百科转储是要走的路,这要归功于指出它们的回答者.我最终使用的是英文版本:http://download.wikimedia.org/enwiki/20090306/,西班牙文件大小只有一半.它们是一些清理工作,但非常值得,它们在链接中包含许多有用的数据.
python ×4
postgresql ×2
.net-3.5 ×1
algorithm ×1
colors ×1
corpus ×1
django ×1
encoding ×1
excel ×1
excel-2007 ×1
geometry ×1
gis ×1
gql ×1
hotkeys ×1
html ×1
html5 ×1
linguistics ×1
mnemonics ×1
mod-python ×1
mod-wsgi ×1
nlp ×1
php ×1
postgis ×1
psycopg2 ×1
shell ×1
sql ×1
utf-8 ×1
vim ×1
vsto ×1