计算java中句子中每个单词的频率

Sig*_*gma 11 java string words extract

我正在写一个非常基本的java程序,计算一个句子中每个单词的频率到目前为止我设法做了这么多

import java.io.*;

class Linked {

    public static void main(String args[]) throws IOException {

        BufferedReader br = new BufferedReader(
            new InputStreamReader(System.in));
        System.out.println("Enter the sentence");
        String st = br.readLine();
        st = st + " ";
        int a = lengthx(st);
        String arr[] = new String[a];
        int p = 0;
        int c = 0;

        for (int j = 0; j < st.length(); j++) {
            if (st.charAt(j) == ' ') {
                arr[p++] = st.substring(c,j);
                c = j + 1;
            }
        }
    }

    static int lengthx(String a) {
        int p = 0;
        for (int j = 0; j < a.length(); j++) {
            if (a.charAt(j) == ' ') {
                p++;
            }
        }
        return p;
    }
}
Run Code Online (Sandbox Code Playgroud)

我已经提取了每个字符串并将其存储在一个数组中,现在的问题实际上是如何计算每个'字'重复的实例的数量以及如何显示以便重复的单词不会多次显示,你能帮助我吗?一个?

Evg*_*eev 22

使用带有单词作为键的地图并计为值,就像这样

    Map<String, Integer> map = new HashMap<>();
    for (String w : words) {
        Integer n = map.get(w);
        n = (n == null) ? 1 : ++n;
        map.put(w, n);
    }
Run Code Online (Sandbox Code Playgroud)

如果你不允许使用java.util,那么你可以使用一些排序算法对arr进行排序并执行此操作

    String[] words = new String[arr.length];
    int[] counts = new int[arr.length];
    words[0] = words[0];
    counts[0] = 1;
    for (int i = 1, j = 0; i < arr.length; i++) {
        if (words[j].equals(arr[i])) {
            counts[j]++;
        } else {
            j++;
            words[j] = arr[i];
            counts[j] = 1;
        }
    }
Run Code Online (Sandbox Code Playgroud)

自Java 8起使用ConcurrentHashMap的有趣解决方案

    ConcurrentMap<String, Integer> m = new ConcurrentHashMap<>();
    m.compute("x", (k, v) -> v == null ? 1 : v + 1);
Run Code Online (Sandbox Code Playgroud)


小智 11

在Java 8中,您可以用两个简单的行来编写它!此外,您还可以利用并行计算.

这是最美妙的方式:

Stream<String> stream = Stream.of(text.toLowerCase().split("\\W+")).parallel();

Map<String, Long> wordFreq = stream
     .collect(Collectors.groupingBy(String::toString,Collectors.counting()));
Run Code Online (Sandbox Code Playgroud)