小编Rob*_*rtH的帖子

NLP /机器学习文本比较

我目前正在开发一个程序,能够将一个小文本(比如250个字符)与一组类似文本(大约1000-2000个文本)进行比较.

目的是评估文本A是否与集合中的一个或多个文本类似,如果是,则集合中的文本必须可通过ID检索.每个文本都有一个唯一的ID.

我希望输出有两种方式:

选项1: 文本匹配的文本B具有90%的相似性,文本C具有70%的相似性,依此类推.

选项2: 文本匹配的文本D具有最高的相似性

我在学校读过一些机器学习,但我不确定哪种算法最适合这个问题,或者我应该考虑使用NLP(不熟悉该主题).

有没有人建议使用什么算法或哪里可以找到解决我的问题的nessecary文献?

谢谢你的贡献!

nlp compare machine-learning

15
推荐指数
1
解决办法
2万
查看次数

股票价格的数据库建模

我最近接到的任务是为适合存储 140 多家公司的股票价格的数据库建模。从所有这些公司每天 8.5 小时,每 15 分钟收集一次数据。我现在面临的问题是如何设置数据库以实现给定这些数据的快速搜索/获取。

一种解决方案是将所有内容存储在一个表中,其中包含以下列:

| Company name | Price | Date | Etc... |
Run Code Online (Sandbox Code Playgroud)

或者我可以为每家公司创建一个表,并只存储收集数据时的价格和日期(以及其他未知 atm 的参数)。

您对这些解决方案有何看法?我希望问题得到了足够详细的解释,否则请告诉我。

任何其他解决方案将不胜感激!

sql database database-design

5
推荐指数
3
解决办法
8896
查看次数

IOCP AcceptEx在连接时未创建完成

我目前正在尝试一些用于套接字编程的新库(IOCP).我偶然发现了AcceptEx功能来启用异步连接.

正如文件所说:

与accept函数不同,AcceptEx函数使用重叠的I/O. 如果您的应用程序使用AcceptEx,它可以使用相对较少的线程为大量客户端提供服务.与所有重叠的Windows功能一样,Windows事件或完成端口可用作完成通知机制.

但是当客户端连接时我没有收到任何完成.但是,当客户端发送数据时,我会完成.

这是我的代码:

DWORD dwBytes;
GUID GuidAcceptEx = WSAID_ACCEPTEX;
int iResult = WSAIoctl(m_hSocket, SIO_GET_EXTENSION_FUNCTION_POINTER,
    &GuidAcceptEx, sizeof (GuidAcceptEx), 
    &m_lpfnAcceptEx, sizeof (m_lpfnAcceptEx), 
    &dwBytes, NULL, NULL);

if (iResult == SOCKET_ERROR)
{
    CloseSocket();
}
Run Code Online (Sandbox Code Playgroud)

然后:

WSAOVERLAPPED olOverlap;
memset(&olOverlap, 0, sizeof (olOverlap));
char lpOutputBuf[1024];
int outBufLen = 1024;
DWORD dwBytes;

BOOL bRet = m_lpfnAcceptEx( m_hSocket, hSocket, lpOutputBuf,
             outBufLen - ((sizeof (sockaddr_in) + 16) * 2),
             sizeof (sockaddr_in) + 16, sizeof (sockaddr_in) + 16, 
             &dwBytes, &olOverlap);
if ( bRet == FALSE …
Run Code Online (Sandbox Code Playgroud)

c++ windows winsock iocp

2
推荐指数
1
解决办法
2095
查看次数