标签: sentence

stanford Core NLP:从文本中分割句子

我是stanford Core NLP的新手.我想用它来分割英文,德文,法文文本中的句子.哪个班级有效?提前感谢.

java nlp stanford-nlp sentence

4
推荐指数
1
解决办法
1万
查看次数

如何只在句子的开头大写字母,下一个字是正常的

我用这个:

Static PreviousLetter As Char
    If PreviousLetter = " "c Or TextBox1.Text.Length = 0 Then
        e.KeyChar = Char.ToUpper(e.KeyChar)
    End If
    PreviousLetter = e.KeyChar
Run Code Online (Sandbox Code Playgroud)

但结果总是:

Good Night Every Body
Run Code Online (Sandbox Code Playgroud)

我如何才能将句子中的第一个字母大写,而将其他字母保持正常?我想要的结果是:

Good night every body
Run Code Online (Sandbox Code Playgroud)

vb.net capitalize sentence

4
推荐指数
2
解决办法
2万
查看次数

仅当列不为NULL时才连接列

我有一个像这样的SQL Server表:

-------------------------------------------------------------------
PERSON
-------------------------------------------------------------------
   NAME   |   PHONE   |   PHONE1   |   PHONE2   |   PHONE_CONCAT  
-------------------------------------------------------------------
   Name1  |   12345   |   Null     |   Null     |   Null
   Name2  |   Null    |   54774    |   Null     |   Null
   Name3  |   Null    |   Null     |   77841    |   Null
-------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

我想要做的是,当其中一列的值为!= null时,将PHONE,PHONE1和PHONE2列连接到PHONE_CONCAT.因此,在这种情况下,PHONE_CONCAT列的最终值将是:

------------------
PERSON
------------------
   PHONE_CONCAT  
------------------
   12345
   54774
   77841
 ------------------
Run Code Online (Sandbox Code Playgroud)

你可以帮我做一下这个动作吗?

我想更新PHONE_CONCAT值,因此我需要对表中的每一行执行更新.

sql t-sql sql-server sentence

4
推荐指数
1
解决办法
3704
查看次数

使用引导程序在一行中包含文本的最佳方法

我遇到了样式问题。将我的文本行放在一行中的最佳方法是什么?问题截图:

在此处输入图片说明

我的代码相当简单:

<section id="key-features" class="key-features">
        <div class="container">
            <h2>Key Features</h2>
            <div class="col-md-4 col-sm-4 col-xs-12">
                <ul>
                    <li><img src="images/icons/1.png" alt="Atmospheric pressure test"/>Atmospheric pressure test</li>
                    <li><img src="images/icons/compass.png" alt="Altitude monitor"/>Altitude monitor</li>
                    <li><img src="images/icons/alc.png" alt="Temperature"/>Temperature test</li>
                    <li><img src="images/icons/hr.png" alt="Heart rate"/>Heart rate monitor</li>
                    <li><img src="images/icons/shoe.png" alt="Pedometer"/>Pedometer</li>
                </ul>
            </div>
            <div class="col-md-4 col-sm-4 col-xs-12 pull-left">
                <ul>
                    <li><img src="images/icons/food.png" alt="Calorie"/>Calorie</li>
                    <li><img src="images/icons/location.png" alt="Distance"/>Distance</li>
                    <li><img src="images/icons/sleep.png" alt="Sleep monitor"/>Sleep monitor</li>
                    <li><img src="images/icons/bell.png" alt="Sedentary remind"/>Sedentary remind</li>
                    <li><img src="images/icons/drink.png" alt="Water drink remind"/>Water drink remind</li>
                </ul>
            </div>
            <div class="col-md-4 col-sm-4 col-xs-12 pull-left">
                <ul>
                        <li><img src="images/icons/alarm.png" …
Run Code Online (Sandbox Code Playgroud)

css sentence twitter-bootstrap

3
推荐指数
1
解决办法
1万
查看次数

句子转换器如何预测新的例子

我正在探索句子转换器并发现了此页面。它展示了如何训练我们的自定义数据。但我不确定如何预测。如果有两个新句子,例如 1)这是第三个示例,2)这是第三个示例。我怎样才能预测这些句子的相似程度?

from sentence_transformers import SentenceTransformer, InputExample, losses
from torch.utils.data import DataLoader

#Define the model. Either from scratch of by loading a pre-trained model
model = SentenceTransformer('distilbert-base-nli-mean-tokens')

#Define your train examples. You need more than just two examples...
train_examples = [InputExample(texts=['My first sentence', 'My second sentence'], label=0.8),
    InputExample(texts=['Another pair', 'Unrelated sentence'], label=0.3)]

#Define your train dataset, the dataloader and the train loss
train_dataloader = DataLoader(train_examples, shuffle=True, batch_size=16)
train_loss = losses.CosineSimilarityLoss(model)

#Tune the model
model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=1, warmup_steps=100)
Run Code Online (Sandbox Code Playgroud)

----------------------------更新1 …

python nlp sentence sentence-similarity huggingface-transformers

3
推荐指数
1
解决办法
2579
查看次数

如何将句子分成Java部分?

我怎么可以把类似的句子"He and his brother playing football."成几部分一样"He and","and his","his brother","brother playing""playing football".是否可以通过使用Java来实现?

java string sentence

2
推荐指数
1
解决办法
1万
查看次数

删除python中句子末尾的句点

我有这样的句子 - "这是一个测试.4.55和5,000." 我想删除句子末尾的句号,但不删除数字之间的句号.我的输出必须是 - "这是一个测试4.55和5,000"我尝试了以下选项,但没有得到所需的输出:

wordList = "this is a test. 4.55 and 5,000."
pattern3 = re.compile("[^\w\d]+")
wordList = pattern3.sub(' ',wordList)
Run Code Online (Sandbox Code Playgroud)

还尝试了以下2:

pattern3 = re.compile("[^\w]|^[0-9]\.[0-9]")
pattern3 = re.compile("[^\w]|^([0-9]/.[0-9]+)")
Run Code Online (Sandbox Code Playgroud)

我不知道我哪里错了.有人可以给我一些指示吗?我搜索了之前的帖子并尝试了它们,但它们并不适用于我的情况.

python regex sentence

2
推荐指数
2
解决办法
5436
查看次数

快速将文本拆分成句子(Java)

我有一套文章描述,我必须将文本分成句子.第一个实现使用opennlp工具sentdetect,它工作得非常好,但对我来说太慢了.有没有类似的东西表现得更快,并且质量相似或略差的结果?

注意:我正在使用(大量的)简短的德语文本.

java performance nlp sentence opennlp

2
推荐指数
1
解决办法
2283
查看次数

python spacy句子分割器

我想用它spacy从文本中取出句子。

nlp = English()  # just the language with no model
sentencizer = nlp.create_pipe("sentencizer")
nlp.add_pipe(sentencizer)
doc = nlp("This is a sentence. This is another sentence.")
for sent in doc.sents:
    print(sent.text)
Run Code Online (Sandbox Code Playgroud)

是否有可能提高句子分割器绕过规则的可靠性,例如从不在像“no.”这样的首字母缩略词之后分割句子。

当然,想象一下我有一堆非常技术性和特殊的缩写词。
你将如何进行?

python sentence spacy

2
推荐指数
1
解决办法
1858
查看次数

当句子不在句子中时,不能得到程序打印"不在句子里"

我有一个程序,要求输入一个句子,然后要求一个单词,并告诉你该单词的位置:

sentence = input("enter sentence: ").lower()
askedword = input("enter word to locate position: ").lower()
words = sentence.split(" ")

for i, word in enumerate(words):
     if askedword == word :
          print(i+1)
    #elif keyword != words :
         #print ("this not")
Run Code Online (Sandbox Code Playgroud)

但是当我编辑它时,我无法使程序正常工作,如果输入的单词不在句子中,则打印"这不在句子中"

python words enumerate python-3.x sentence

1
推荐指数
1
解决办法
130
查看次数

Gensim Doc2Vec - 为什么 infer_vector() 使用 alpha?

我尝试将句子映射到向量,以使句子相互比较。为了测试 gensim 的 Doc2Vec 模型,我下载了 sklearn 的新闻组数据集并在其上训练模型。

为了比较两个句子,我使用 model.infer_vector() 并且我想知道为什么使用同一句子的两个调用会为我提供不同的向量:

model = Doc2Vec(vector_size=100, window=8, min_count=5, workers=6)
model.build_vocab(documents)

epochs=10
for epoch in range(epochs):
    print("Training epoch %d" % (epoch+1))
    model.train(documents,  total_examples=len(documents), epochs=epochs)

    v1 = model.infer_vector("I feel good")
    v2 = model.infer_vector("I feel good")
    print(np.linalg.norm(v1-v2)) 
Run Code Online (Sandbox Code Playgroud)

输出:

训练时期 1

0.41606528

训练时期 2

0.43440753

训练纪元 3

0.3203116

训练纪元 4

0.3039317

训练纪元 5

0.68224543

训练时期 6

0.5862567

训练纪元 7

0.5424634

训练纪元 8

0.7618142

训练纪元 9

0.8170159

训练纪元 10

0.6028216

如果我设置 alpha 和 min_alpha = 0,我会得到“我感觉很好”和“我感觉很好”的一致向量,但模型在每个时期都给我相同的向量,所以它似乎没有学到任何东西:

训练时期 1 …

embedding sentence gensim doc2vec

1
推荐指数
1
解决办法
2779
查看次数

无法 pip install -U 语句转换器

我无法做到:pip install -U sentence-transformers。我在 Anaconda Prompt 上收到此消息:错误:找不到满足要求的版本 torch>=1.0.1(来自句子转换器)(来自版本:0.1.2、0.1.2.post1、0.1.2.post2 ) 错误:没有找到与 torch>=1.0.1 匹配的分布(来自句子转换器)有人可以帮忙吗?

transformer-model sentence bert-language-model

1
推荐指数
1
解决办法
3575
查看次数

打印这句话中的每个单词

我有以下句子:

This is a text and we should print each word
Run Code Online (Sandbox Code Playgroud)

我想打印这句话中的每个单词.

package lab2_3;

public  class Main {

    public static void main(String[] args) {

        String s2 = "This is a text and we should print each word";


        int i;
        int j;
        for (i = 0; i <= s2.length() - 1; i++){
            if (s2.substring(i).startsWith(" ") || i == 0){

                //here I search for the start of the sentence or " "
                for (j = i + 1; j <= s2.length() - …
Run Code Online (Sandbox Code Playgroud)

java cpu-word sentence

0
推荐指数
1
解决办法
2万
查看次数