标签: gumbo

使用 Julia 从 HTML 文件中提取和构建表格

这是示例 html 文件的公共链接。我想从文件中提取每组 CAN 和年度税收信息(下图中以红色突出显示的示例),并构建一个如下所示的数据框。

目标字段

在此处输入图片说明

示例数据帧

| Row |          CAN | Crtf_NoCrtf | Tax_Year | Land_Value | Improv_Value | Total_Value | Total_Tax |
|-----+--------------+-------------+----------+------------+--------------+-------------+-----------|
|   1 | 184750010210 | Yes         |     2016 |      16720 |       148330 |      165050 | 4432.24   |
|   2 | 184750010210 | Yes         |     2015 |      16720 |       128250 |      144970 | 3901.06   |
|   3 | 184750010210 | Yes         |     2014 |      16720 |       109740 |      126460 | 3412.63   |
|   4 …
Run Code Online (Sandbox Code Playgroud)

html html-parsing gumbo julia

8
推荐指数
2
解决办法
2356
查看次数

Flex 4:构建具有背景的组

我正在尝试构建一个简单的组件,将spark.components.Group扩展为具有背景颜色,更具体地说是一个spark.primitives.Rect组件,它被拉伸以填充背景.

这就是我到目前为止所提出的:

<s:Group xmlns:fx="http://ns.adobe.com/mxml/2009" xmlns:s="library://ns.adobe.com/flex/spark" xmlns:mx="library://ns.adobe.com/flex/halo"
    <fx:Metadata>
        [DefaultProperty(name="content")]
    </fx:Metadata>

    <s:Rect id="background" width="100%" height="100%">
        <s:fill>
            <s:SolidColor color="#990000"/>
        </s:fill>
    </s:Rect>

    <s:Group id="container"/>

    <s:filters>
        <!-- For good measure ;) -->
        <s:DropShadowFilter color="#000000" strength="0.4" blurX="5" blurY="5" distance="2" angle="90"/>
    </s:filters>

    <fx:Script>
        <![CDATA[
            public function set content(value:Array):void {
                this.container.mxmlContent = value;
            }
        ]]>
    </fx:Script>
</s:Group>
Run Code Online (Sandbox Code Playgroud)

好的,所以这里的逻辑基本上是有道理的,对吧?在MXML中声明的所有子项都转到名为"container"的组中.这工作得很好.但是,当我运行下面的示例时,布局完全是fubar.

<s:VGroup>
    <!-- This is the component described above -->
    <components:MessageContainer id="component" width="100" height="100"/>
    <mx:Slider/>
    <mx:Slider/>
    <mx:ColorPicker/>
</s:VGroup>
Run Code Online (Sandbox Code Playgroud)

这就是它的样子:

flex fubar http://i34.tinypic.com/s4p0tz.jpg

这里有什么我想念的吗?也许我需要覆盖一种方法?

apache-flex mxml actionscript-3 gumbo flex4

6
推荐指数
1
解决办法
1万
查看次数

如何在Flex 4中在运行时设置外观

我有一堆基于SkinnableContainer的自定义控件.

在设计时添加控件时,我可以使用标签上的skinClass属性指定外观.

我需要在运行时添加一些这些元素,我无法弄清楚如何为我的控件指定skinClass.

例如.

var something:CustomThing = new CustomThing();

/* mistery code here to attach the skin ? */

addElement(something);
Run Code Online (Sandbox Code Playgroud)

我该怎么做呢?

谢谢!

runtime skin gumbo flex4

5
推荐指数
1
解决办法
7544
查看次数

A 中的 Gumbo HTML 文本

我使用的Gumbo解析在网页中CP1251。我已将文本转换为UTF-8并将其发送到秋葵汤解析器。我在获取A链接中的文本时遇到问题

node->v.text.text
Run Code Online (Sandbox Code Playgroud)

当源正确显示在控制台中时,我在输出中看到奇怪的符号。我正在使用Qt 5.2libiconv用于转换目的。

我需要将节点文本转换为本地代码页还是我做错了什么?

进入页面 CP1251

    QByteArray barrData = pf->getData();

    size_t dstlen = 1048576;
    char buf[dstlen];
    memset((char*)buf, 0, dstlen);

    char* pIn = barrData.data();
    char* pOut = (char*)buf;

    size_t srclen = barrData.size();


    iconv_t conv = iconv_open("UTF-8", "CP1251");
    iconv(conv, &pIn, &srclen, &pOut, &dstlen);
    iconv_close(conv);

    GumboOutput* output = gumbo_parse(buf);

    parsePage(output->root);
    gumbo_destroy_output(&kGumboDefaultOptions, output);
Run Code Online (Sandbox Code Playgroud)

解析

if (node->v.element.tag == GUMBO_TAG_DIV && (_class = gumbo_get_attribute(&node->v.element.attributes, "class")))
{
    if (QString(_class->value) == "catalog-item-title")
    {
        qDebug() << …
Run Code Online (Sandbox Code Playgroud)

c++ qt gumbo

3
推荐指数
1
解决办法
2538
查看次数

FileReference和HttpService浏览图片修改它然后上传它

我正在尝试做一个图像上传器,用户可以:
- 使用button.browse浏览本地文件
- 选择一个并将其保存为FileReference.
- 然后我们做FileReference.load()然后将数据绑定到我们的图像控件.
- 在我们对其进行旋转并更改图像数据之后.
- 并完成我们将其上传到服务器.

要更改图像数据,我将获得显示图像的矩阵并对其进行转换,然后重新使用新矩阵并将其绑定到我的旧图像:

private function TurnImage():void
{ 
    //Turn it
    var m:Matrix = _img.transform.matrix;
    rotateImage(m);
    _img.transform.matrix = m;
}
Run Code Online (Sandbox Code Playgroud)

现在主要的是我真的不知道如何将数据作为文件发送到我的服务器,因为它没有存储在FileReference中,FileReference中的数据是readOnly所以我们无法更改它或创建新的,所以我可以不要使用.upload();.

然后我尝试了HttpService.send,但我无法弄清楚你是如何发送文件而不是mxml的.

apache-flex upload httpservice filereference gumbo

1
推荐指数
1
解决办法
3073
查看次数

在C++类实现中调用C函数

我必须使用用C编写的https://github.com/google/gumbo-parser库.

我有一个HtmlParser定义的类,HtmlParser.h我实现了它的方法HtmlParser.cpp

包括我gumbo.hHtmlParser.h和调用它的函数中实现由我getLinks(...)的功能就是在HtmlParser.cpp

当我尝试编译它时,我得到未定义的引用'gumbo_parse' 我该如何修复它?

我的makefile是

cmake_minimum_required(VERSION 3.3)
project(WebCrawler)

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11")
set(SOURCE_FILES main.cpp HtmlParser.cpp HtmlParser.h)
add_executable(WebCrawler ${SOURCE_FILES})
Run Code Online (Sandbox Code Playgroud)

c++ cmake gumbo clion

1
推荐指数
1
解决办法
421
查看次数