小编Par*_*ait的帖子

Pandas read_xml() method test strategies

Interestingly, pandas I/O tools does not maintain a read_xml() method and the counterpart to_xml(). However, read_json proves tree-like structures can be implemented for dataframe import and read_html for markup formats.

Now, if the pandas team does consider such a read_xml method for a future pandas version, what implementation would they pursue: parsing with built-in xml.etree.ElementTree with its iterfind() or iterparse() functions or the third-party module, lxml with its XPath 1.0 and XSLT 1.0 methods?

下面是我在一个简单,扁平,以元素为中心的XML输入上的四种方法类型的测试运行.所有这些都设置为root的任何二级子级的基因化解析,并且每个方法应该产生完全相同的pandas数据帧.除了pd.Dataframe()字典列表上的最后一次调用之外的所有内容.该XSLT转换的方法,以XML为CSV铸造StringIO()在 …

python xml xslt xpath pandas

77
推荐指数
1
解决办法
5525
查看次数

使用Python 3.6连接MySQL

我正在寻找一个用Python 3.6连接到MySQL的库.我发现的所有库只适用于旧版本的Python.遗憾的是,我无法更改为旧的Python版本,因为我需要一些在Python 3.6中引入的函数.

我正在使用覆盆子pi3编程,但我不认为这应该改变任何东西.

谢谢你的帮助!

python mysql database raspberry-pi

18
推荐指数
1
解决办法
6万
查看次数

使用R嵌入在SQL中的累积量度

原谅我,我是R的新手,我只是在看我们SQL 2016环境中的选项.

我们目前要求提供累积的绩效回报.下面是一个示例数据集:

FundID  Date        FundReturn
ABC     1987-10-31  0
ABC     1987-11-30  -9.28669
ABC     1987-12-31  3.08304
ABC     1988-01-31  -3.00125
ABC     1988-02-29  0.61238
ABC     1988-03-31  4.29258
ABC     1988-04-30  0.13697
ABC     1988-05-31  2.57786
ABC     1988-06-30  2.36947
ABC     1988-07-31  0.57114
ABC     1988-08-31  -1.21550
ABC     1988-09-30  7.09027
ABC     1988-10-31  3.45807
ABC     1988-11-30  1.12679
Run Code Online (Sandbox Code Playgroud)

我们需要获取此数据集并对其应用累积性能返回度量,以便datset如下所示:

FundID  Date        FundReturn      FundReturnCumu100   FundReturnCumu0
ABC     1987-10-31  0               1                   0
ABC     1987-11-30  -9.28669        0.9071331           -0.0928669
ABC     1987-12-31  3.08304         0.935100376         -0.064899624
ABC     1988-01-31  -3.00125        0.907035676         -0.092964324
ABC     1988-02-29  0.61238         0.912590181         -0.087409819
ABC …
Run Code Online (Sandbox Code Playgroud)

sql sql-server r

18
推荐指数
2
解决办法
256
查看次数

pyodbc.ProgrammingError: ('42000', "[42000] [Microsoft][ODBC SQL Server 驱动程序][SQL Server]附近语法不正确

我正在使用 python 3.9 使用 pyobc 将多个新闻列表从 google rss news 插入到带有参数的 SQL 表中,但总是出现以下编程错误:

\n
\n

Cursor.execute(query) pyodbc.ProgrammingError: ('42000', "[42000] [Microsoft][ODBC SQL Server 驱动程序][SQL Server]'c\xc3\xb2'\n 附近的语法不正确。(102) (SQLExecDirectW )”)

\n
\n

我检查了sql表,发现实际上有一些记录已成功导入到SQL(15条记录),但不是全部(30条记录)

\n

下面是我的所有代码,请帮忙!

\n
import bs4\nfrom bs4 import BeautifulSoup as soup\nfrom urllib.request import urlopen\nimport pyodbc\n\nnews_url="https://news.google.com/rss?hl=vi&gl=VN&ceid=VN:vi"\nClient=urlopen(news_url)\nxml_page=Client.read()\nClient.close()\nsoup_page=soup(xml_page,"xml")\nnews_list=soup_page.findAll("item")\n\ncnxn = pyodbc.connect('DRIVER={SQL Server};SERVER=ADMIN;DATABASE=NewsCollect2')\ncursor = cnxn.cursor()\n\nfor news in news_list:\n    query = f"insert into news2(Title,Source1,Time1) values (N'"+news.title.text+"',N'"+news.source.text+"',N'"+news.pubDate.text+"')"\n    cursor.execute(query)\n    cursor.commit()\ncursor.close()\ncnxn.close()\n
Run Code Online (Sandbox Code Playgroud)\n

p/s 我尝试提取到 txt 文件,它工作得很好

\n

python sql-server beautifulsoup pyodbc

8
推荐指数
2
解决办法
6万
查看次数

从Excel调用的Access vba函数会返回不同的值

我的最终目标是生成一个工具来预测字符串的宽度,以便在MS Access 2010中打印报表时可以避免文本溢出.类似CanGrow的选项没用,因为我的报表不能有不可预测的分页符.我无法切断文字.

为此,我WizHook.TwipsFromFont在Access中发现了未记录的函数.在给定字体和其他特征的情况下,它返回字符串的缇宽度.它已被证明是非常有用的起点.基于各种用户生成的指南,我在Access中开发了以下内容:

Public Function TwipsFromFont(ByVal sCaption As String, ByVal sFontName As String, _
                              ByVal lSize As Long, Optional ByVal lWeight As Long = 400, _
                              Optional bItalic As Boolean = False, _
                              Optional bUnderline As Boolean = False, _
                              Optional lCch As Long = 0, _
                              Optional lMaxWidthCch As Long = 0) As Double

    'inspired by http://www.team-moeller.de/?Tipps_und_Tricks:Wizhook-Objekt:TwipsFromFont

    WizHook.Key = 51488399

    Dim ldx As Long
    Dim ldy As Long

    Call WizHook.TwipsFromFont(sFontName, lSize, lWeight, bItalic, bUnderline, …
Run Code Online (Sandbox Code Playgroud)

excel ms-access vba excel-vba

7
推荐指数
1
解决办法
730
查看次数

Excel VBA映射过滤的XML到表

我有以下代码将XML Schema映射到Excel表(如在ListObjects中).

Sub MapXMLFieldsToExcelCells(wb As Workbook, sLOB As String)

'*******************************************************************
'**    Name:        xmlFieldMap
'**    Purpose:     Maps fields of existing xlmMap (named "xmlData") to file
'**    Dependents:  TieXMLToExcel (remapping of xml file)
'**    Notes:
'*******************************************************************

sProcName = "MapXMLFieldsToExcelCells"

With wb

    Dim xMap As XmlMap
    Set xMap = .XmlMaps(sLOB)

    Dim wsXMLMain As Worksheet

    Set wsXMLMain = .Worksheets("xml" & IIf(Left(.Name, 2) = "SA", "SA", "") & sLOB)

    Dim wsConfig As Worksheet
    Set wsConfig = .Worksheets("rConfig")

    With wsConfig

        Dim rNode As Range
        For Each …
Run Code Online (Sandbox Code Playgroud)

xml excel vba filter excel-vba

7
推荐指数
0
解决办法
764
查看次数

使用Rcpp重写R的cummin()函数并允许NA

我正在学习Rcpp.在这个例子中,我试图cummin()像基本R一样滚动我自己的函数cummin(),除了我希望我的版本有一个na.rm参数.这是我的尝试

cummin.cpp

#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
NumericVector cummin_cpp(NumericVector x, bool narm = false){
  // Given a numeric vector x, returns a vector of the 
  // same length representing the cumulative minimum value
  // if narm = true, NAs will be ignored (The result may 
  // contain NAs if the first values of x are NA.)
  // if narm = false, the resulting vector will return the 
  // cumulative min …
Run Code Online (Sandbox Code Playgroud)

r rcpp

7
推荐指数
1
解决办法
158
查看次数

使用RODBC插入MS-Access数据库中的备注字段时,"无法分配内存"

我正在尝试使用sqlSaveRODBC中的函数向包含备注字段的Microsoft Access数据库中的表插入新行,并且我收到以下错误:

calloc'无法分配内存(107字节为1字节)odbcUpdate通道查询mydata coldata [m,] test verbose nastring

通过设置verbose = TRUE,我在错误之前得到的最后一行是:

Binding: 'notes' DataType -1, ColSize 1073741823
Run Code Online (Sandbox Code Playgroud)

看起来它正在获得备注字段的最大大小,看起来是1GB,然后尝试分配那么多内存.如果我在Access中将字段类型更改为"text",则插入工作正常而不会更改我的代码.有没有办法避免这种行为,或者在字段中存储超过255个字符的文本的替代方法?

sql ms-access r rodbc

6
推荐指数
1
解决办法
534
查看次数

如何使用Excel VBA在运行时打开MS Access?

我正在努力研究如何使用VBA从Excel文件打开MS Access Runtime.

您可以使用打开完整版Access CreateObject("Access.Application"),但不能在运行时打开Access.

我们只在某些计算机上安装了Microsoft Access Runtime,因为我们需要使用我们开发的前端.所以我们需要使用MS Access Runtime打开accdb文件,但是要从Excel打开.

感谢任何帮助,谢谢

excel ms-access vba excel-vba access-vba

6
推荐指数
1
解决办法
1530
查看次数

使用facet_wrap的百分比直方图

我正在尝试将百分比直方图与facet_wrap,但百分比不是基于组计算的,而是所有数据.我希望每个直方图显示一组中的分布,而不是相对于所有人口.我知道可以做几个情节并将它们结合起来multiplot.

library(ggplot2)
library(scales)
library(dplyr)

set.seed(1)
df <- data.frame(age = runif(900, min = 10, max = 100),
                 group = rep(c("a", "b", "c", "d", "e", "f", "g", "h", "i"), 100))

tmp <- df %>%
  mutate(group = "ALL")

df <- rbind(df, tmp)

ggplot(df, aes(age)) + 
  geom_histogram(aes(y = (..count..)/sum(..count..)), binwidth = 5) + 
  scale_y_continuous(labels = percent ) + 
  facet_wrap(~ group, ncol = 5) 
Run Code Online (Sandbox Code Playgroud)

输出: 输出图

r histogram ggplot2 facet-wrap

6
推荐指数
1
解决办法
825
查看次数