小编Zed*_*gan的帖子

如何使用Java解析Talend中的数据(来自以前生成的.txt文件)?

我在Talend中有一个进程,它获取页面的搜索结果,保存html并将其写入文件,如下所示:

在此输入图像描述

最初我有一个两步过程,用Java解析HTML文件中的日期.这是代码:它工作并将其写入mysql数据库.这是基本上完全正确的代码.(我是初学者,抱歉缺乏优雅)

package org.jsoup.examples;

import java.io.*;   

import org.jsoup.*;
import org.jsoup.nodes.*;
import org.jsoup.select.Elements;

import java.io.IOException;


public class parse2 {       
    static parse2 parseIt2 = new parse2();
    String companyName = "Platzhalter";
    String jobTitle = "Platzhalter";
    String location = "Platzhalter";
    String timeAdded = "Platzhalter";

    public static void main(String[] args) throws IOException {
        parseIt2.getData();
    }

    // 
    public void getData() throws IOException {
        Document document = Jsoup.parse(new File("C:/Talend/workspace/WEBCRAWLER/output/keywords_SOA.txt"), "utf-8");
        Elements elements = document.select(".joblisting");
        for (Element element : elements) {
            // Parse Data into Elements
            Elements jobTitleElement …
Run Code Online (Sandbox Code Playgroud)

java parsing talend jsoup

39
推荐指数
1
解决办法
3168
查看次数

如何达到所需标准时结束tLoop

这是我的过程:

作业布局和tJava_1配置

您可以在tJava_1中看到Java代码.它解析文件中的数据,如果它到达最后一个搜索页面,它会将值设置为true.这是tLoop_1的停止标准,如下所示:

tLoop配置

我处理Talend变量错了吗?一旦达到Java代码中的条件,如何阻止循环运行?

java talend

3
推荐指数
1
解决办法
8199
查看次数

标签 统计

java ×2

talend ×2

jsoup ×1

parsing ×1