我是stanford Core NLP的新手.我想用它来分割英文,德文,法文文本中的句子.哪个班级有效?提前感谢.
我用这个:
Static PreviousLetter As Char
If PreviousLetter = " "c Or TextBox1.Text.Length = 0 Then
e.KeyChar = Char.ToUpper(e.KeyChar)
End If
PreviousLetter = e.KeyChar
Run Code Online (Sandbox Code Playgroud)
但结果总是:
Good Night Every Body
Run Code Online (Sandbox Code Playgroud)
我如何才能将句子中的第一个字母大写,而将其他字母保持正常?我想要的结果是:
Good night every body
Run Code Online (Sandbox Code Playgroud) 我有一个像这样的SQL Server表:
-------------------------------------------------------------------
PERSON
-------------------------------------------------------------------
NAME | PHONE | PHONE1 | PHONE2 | PHONE_CONCAT
-------------------------------------------------------------------
Name1 | 12345 | Null | Null | Null
Name2 | Null | 54774 | Null | Null
Name3 | Null | Null | 77841 | Null
-------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)
我想要做的是,当其中一列的值为!= null时,将PHONE,PHONE1和PHONE2列连接到PHONE_CONCAT.因此,在这种情况下,PHONE_CONCAT列的最终值将是:
------------------
PERSON
------------------
PHONE_CONCAT
------------------
12345
54774
77841
------------------
Run Code Online (Sandbox Code Playgroud)
你可以帮我做一下这个动作吗?
我想更新PHONE_CONCAT值,因此我需要对表中的每一行执行更新.
我遇到了样式问题。将我的文本行放在一行中的最佳方法是什么?问题截图:
我的代码相当简单:
<section id="key-features" class="key-features">
<div class="container">
<h2>Key Features</h2>
<div class="col-md-4 col-sm-4 col-xs-12">
<ul>
<li><img src="images/icons/1.png" alt="Atmospheric pressure test"/>Atmospheric pressure test</li>
<li><img src="images/icons/compass.png" alt="Altitude monitor"/>Altitude monitor</li>
<li><img src="images/icons/alc.png" alt="Temperature"/>Temperature test</li>
<li><img src="images/icons/hr.png" alt="Heart rate"/>Heart rate monitor</li>
<li><img src="images/icons/shoe.png" alt="Pedometer"/>Pedometer</li>
</ul>
</div>
<div class="col-md-4 col-sm-4 col-xs-12 pull-left">
<ul>
<li><img src="images/icons/food.png" alt="Calorie"/>Calorie</li>
<li><img src="images/icons/location.png" alt="Distance"/>Distance</li>
<li><img src="images/icons/sleep.png" alt="Sleep monitor"/>Sleep monitor</li>
<li><img src="images/icons/bell.png" alt="Sedentary remind"/>Sedentary remind</li>
<li><img src="images/icons/drink.png" alt="Water drink remind"/>Water drink remind</li>
</ul>
</div>
<div class="col-md-4 col-sm-4 col-xs-12 pull-left">
<ul>
<li><img src="images/icons/alarm.png" …Run Code Online (Sandbox Code Playgroud) 我正在探索句子转换器并发现了此页面。它展示了如何训练我们的自定义数据。但我不确定如何预测。如果有两个新句子,例如 1)这是第三个示例,2)这是第三个示例。我怎样才能预测这些句子的相似程度?
from sentence_transformers import SentenceTransformer, InputExample, losses
from torch.utils.data import DataLoader
#Define the model. Either from scratch of by loading a pre-trained model
model = SentenceTransformer('distilbert-base-nli-mean-tokens')
#Define your train examples. You need more than just two examples...
train_examples = [InputExample(texts=['My first sentence', 'My second sentence'], label=0.8),
InputExample(texts=['Another pair', 'Unrelated sentence'], label=0.3)]
#Define your train dataset, the dataloader and the train loss
train_dataloader = DataLoader(train_examples, shuffle=True, batch_size=16)
train_loss = losses.CosineSimilarityLoss(model)
#Tune the model
model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=1, warmup_steps=100)
Run Code Online (Sandbox Code Playgroud)
----------------------------更新1 …
python nlp sentence sentence-similarity huggingface-transformers
我怎么可以把类似的句子"He and his brother playing football."成几部分一样"He and","and his","his brother","brother playing"和"playing football".是否可以通过使用Java来实现?
我有这样的句子 - "这是一个测试.4.55和5,000." 我想删除句子末尾的句号,但不删除数字之间的句号.我的输出必须是 - "这是一个测试4.55和5,000"我尝试了以下选项,但没有得到所需的输出:
wordList = "this is a test. 4.55 and 5,000."
pattern3 = re.compile("[^\w\d]+")
wordList = pattern3.sub(' ',wordList)
Run Code Online (Sandbox Code Playgroud)
还尝试了以下2:
pattern3 = re.compile("[^\w]|^[0-9]\.[0-9]")
pattern3 = re.compile("[^\w]|^([0-9]/.[0-9]+)")
Run Code Online (Sandbox Code Playgroud)
我不知道我哪里错了.有人可以给我一些指示吗?我搜索了之前的帖子并尝试了它们,但它们并不适用于我的情况.
我有一套文章描述,我必须将文本分成句子.第一个实现使用opennlp工具sentdetect,它工作得非常好,但对我来说太慢了.有没有类似的东西表现得更快,并且质量相似或略差的结果?
注意:我正在使用(大量的)简短的德语文本.
我想用它spacy从文本中取出句子。
nlp = English() # just the language with no model
sentencizer = nlp.create_pipe("sentencizer")
nlp.add_pipe(sentencizer)
doc = nlp("This is a sentence. This is another sentence.")
for sent in doc.sents:
print(sent.text)
Run Code Online (Sandbox Code Playgroud)
是否有可能提高句子分割器绕过规则的可靠性,例如从不在像“no.”这样的首字母缩略词之后分割句子。
当然,想象一下我有一堆非常技术性和特殊的缩写词。
你将如何进行?
我有一个程序,要求输入一个句子,然后要求一个单词,并告诉你该单词的位置:
sentence = input("enter sentence: ").lower()
askedword = input("enter word to locate position: ").lower()
words = sentence.split(" ")
for i, word in enumerate(words):
if askedword == word :
print(i+1)
#elif keyword != words :
#print ("this not")
Run Code Online (Sandbox Code Playgroud)
但是当我编辑它时,我无法使程序正常工作,如果输入的单词不在句子中,则打印"这不在句子中"
我尝试将句子映射到向量,以使句子相互比较。为了测试 gensim 的 Doc2Vec 模型,我下载了 sklearn 的新闻组数据集并在其上训练模型。
为了比较两个句子,我使用 model.infer_vector() 并且我想知道为什么使用同一句子的两个调用会为我提供不同的向量:
model = Doc2Vec(vector_size=100, window=8, min_count=5, workers=6)
model.build_vocab(documents)
epochs=10
for epoch in range(epochs):
print("Training epoch %d" % (epoch+1))
model.train(documents, total_examples=len(documents), epochs=epochs)
v1 = model.infer_vector("I feel good")
v2 = model.infer_vector("I feel good")
print(np.linalg.norm(v1-v2))
Run Code Online (Sandbox Code Playgroud)
输出:
训练时期 1
0.41606528
训练时期 2
0.43440753
训练纪元 3
0.3203116
训练纪元 4
0.3039317
训练纪元 5
0.68224543
训练时期 6
0.5862567
训练纪元 7
0.5424634
训练纪元 8
0.7618142
训练纪元 9
0.8170159
训练纪元 10
0.6028216
如果我设置 alpha 和 min_alpha = 0,我会得到“我感觉很好”和“我感觉很好”的一致向量,但模型在每个时期都给我相同的向量,所以它似乎没有学到任何东西:
训练时期 1 …
我无法做到:pip install -U sentence-transformers。我在 Anaconda Prompt 上收到此消息:错误:找不到满足要求的版本 torch>=1.0.1(来自句子转换器)(来自版本:0.1.2、0.1.2.post1、0.1.2.post2 ) 错误:没有找到与 torch>=1.0.1 匹配的分布(来自句子转换器)有人可以帮忙吗?
我有以下句子:
This is a text and we should print each word
Run Code Online (Sandbox Code Playgroud)
我想打印这句话中的每个单词.
package lab2_3;
public class Main {
public static void main(String[] args) {
String s2 = "This is a text and we should print each word";
int i;
int j;
for (i = 0; i <= s2.length() - 1; i++){
if (s2.substring(i).startsWith(" ") || i == 0){
//here I search for the start of the sentence or " "
for (j = i + 1; j <= s2.length() - …Run Code Online (Sandbox Code Playgroud) sentence ×13
java ×4
python ×4
nlp ×3
capitalize ×1
cpu-word ×1
css ×1
doc2vec ×1
embedding ×1
enumerate ×1
gensim ×1
opennlp ×1
performance ×1
python-3.x ×1
regex ×1
spacy ×1
sql ×1
sql-server ×1
stanford-nlp ×1
string ×1
t-sql ×1
vb.net ×1
words ×1