小编oce*_*800的帖子

在Mysql中,索引名称必须在整个数据库中是唯一的吗?

例如,如果我有两个表Teacher并且Student有一个名为的列IDNumber,我是否必须单独命名索引,如下所示:

IDNum_teach
IDNum_stu 
Run Code Online (Sandbox Code Playgroud)

或者我可以在每个表上创建一个索引IDNumber并为它们命名IDNum吗?

mysql sql indexing

25
推荐指数
2
解决办法
5004
查看次数

Pycharm - 没有发现任何测试?

我一直在接受

没有发现任何测试

Pycharm中的错误,我无法弄清楚为什么我会得到它...这就是我对我的看法point_test.py:

import unittest
import sys
import os

sys.path.insert(0, os.path.abspath('..'))

from ..point import Point


class TestPoint(unittest.TestCase):
    def setUp(self):
        pass

    def xyCheck(self,x,y):
        point = Point(x,y)
        self.assertEqual(x,point.x)
        self.assertEqual(y,point.y)
Run Code Online (Sandbox Code Playgroud)

而这point.py,我正在尝试测试:

import unittest

from .utils import check_coincident, shift_point

class Point(object):
    def __init__(self,x,y,mark={}):
        self.x = x
        self.y = y
        self.mark = mark

    def patched_coincident(self,point2):
        point1 = (self.x,self.y)
        return check_coincident(point1,point2)

    def patched_shift(self,x_shift,y_shift):
        point = (self.x,self.y)
        self.x,self,y = shift_point(point,x_shift,y_shift)
Run Code Online (Sandbox Code Playgroud)

我的运行配置有问题吗?我看了这篇 SO帖子,但我仍然感到困惑.我的运行配置目前看起来像这样:

在此输入图像描述

我想我只是明白我可能做错了什么?任何帮助将不胜感激,谢谢!

python unit-testing nose pycharm

19
推荐指数
5
解决办法
2万
查看次数

在MySql工作台中将列设置为时间戳?

这可能是一个非常基本的问题,但我以前从未创建过一个表格TIMESTAMP(),而且我对作为参数的内容感到困惑.例如,这里:

在此输入图像描述

我只是随意放TIMESTAMP(20),但20作为参数在这里表示什么?这里应该放什么?

我用谷歌搜索了这个问题,但是并没有真正想出任何东西......无论如何我是sql的新手,所以任何帮助都会非常感激,谢谢!

mysql sql timestamp mysql-workbench

17
推荐指数
2
解决办法
3万
查看次数

在javascript中读取本地csv文件?

[编辑]我用D3解决了这个问题,谢天谢地!

所以我有一个看起来像这样的csv文件,我需要将本地csv文件导入到我的客户端javascript:

    "L.Name", "F.Name", "Gender", "School Type", "Subjects"
    "Doe",    "John",  "M",      "University",  "Chem I, statistics, English, Anatomy"
    "Tan",    "Betty",   "F",     "High School", "Algebra I, chem I, English 101"
    "Han",    "Anna",    "F",     "University",  "PHY 3, Calc 2, anatomy I, spanish 101"
    "Hawk",   "Alan",    "M",     "University",  "English 101, chem I" 
Run Code Online (Sandbox Code Playgroud)

我最终需要解析它并输出如下内容:

Chem I: 3         (number of people taking each subject)
Spanish 101: 1 
Philosophy 204: 0 
Run Code Online (Sandbox Code Playgroud)

但就目前而言,我只是坚持将其导入javascript.

我当前的代码如下所示:

<!DOCTYPE html>  
<html>  
<body>
<h1>Title!</h1>
<p>Please enter the subject(s) that you …
Run Code Online (Sandbox Code Playgroud)

javascript csv ajax jquery filereader

13
推荐指数
1
解决办法
6万
查看次数

如何用d3 v4读取CSV?

我只是在理解使用D3的CSV Parse文档时遇到一些麻烦.我目前有:

d3.parse("data.csv",function(data){
    salesData = data; 
});
Run Code Online (Sandbox Code Playgroud)

但我继续得到错误:

未捕获的TypeError:d3.parse不是函数

这应该是什么样的?我只是有点困惑,我能找到的唯一例子是这样的.

我也试过类似的东西:

d3.dsv.parse("data.csv",function(data){
    salesData = data; 
});
Run Code Online (Sandbox Code Playgroud)

得到了:

未捕获的TypeError:无法读取未定义的属性'parse'

为什么会这样?任何帮助都会有很大的帮助,谢谢!!

javascript csv d3.js

11
推荐指数
1
解决办法
3万
查看次数

确定文本是否是英文?

我正在使用NltkScikit Learn进行一些文本处理.但是,在我的文件清单中,我有一些非英文文件.例如,以下可能是真的:

[ "this is some text written in English", 
  "this is some more text written in English", 
  "Ce n'est pas en anglais" ] 
Run Code Online (Sandbox Code Playgroud)

出于我的分析目的,我希望将所有非英语句子作为预处理的一部分删除.但是,有一个很好的方法吗?我一直在谷歌搜索,但找不到任何具体的东西,让我能够识别字符串是否为英文.这是不是作为功能提供的东西NltkScikit learn编辑我见过两个这样的问题这个这个,但都是个别单词...不是一个"文件".我是否必须遍历句子中的每个单词以检查整个句子是否是英文的?

我正在使用Python,所以Python中的库会更受欢迎,但我可以根据需要切换语言,只是认为Python是最好的.

python nlp nltk scikit-learn

10
推荐指数
3
解决办法
2万
查看次数

映射矩阵的值?

所以我有一个大矩阵(4091252x2)看起来像这样:

  439105     1053224
  439105     1696241
  439105      580064
  439105     1464748
 1836139     1593258
 1464748      439105
 1464748     1053224
 1464748     1696241
 1464748      580064
  580064      439105
Run Code Online (Sandbox Code Playgroud)

基本上,矩阵表示从一个人到另一个人的呼叫,由personID表示(439105调用1053224).我想要做的是缩小这个矩阵,使最小的personID = 1,下一个最低的personID为2,之后的下一个最低的personID为3,等等.例如,如果矩阵看起来像这样:

110 503
402 110
300 900
300 402
402 110
Run Code Online (Sandbox Code Playgroud)

我希望它映射到:

1 4
3 1
2 5
2 3 
3 1 
Run Code Online (Sandbox Code Playgroud)

问题是我是Matlab的初学者,我不知道如何做到这一点.我调查了重塑sub2ind,但我真的不认为那就是我正在寻找的东西.我将如何在Matlab中实现这一目标?

任何帮助将不胜感激,谢谢!

mapping matlab matrix

8
推荐指数
2
解决办法
417
查看次数

Sklearn Kmeans参数混乱吗?

因此,我可以sklearn kmeans按以下方式运行:

kmeans = KMeans(n_clusters=3,init='random',n_init=10,max_iter=500)
Run Code Online (Sandbox Code Playgroud)

但是我对参数的含义有些困惑

所以n_init说:

k均值算法将在不同质心种子下运行的次数。就惯性而言,最终结果将是n_init个连续运行的最佳输出。

max_iter说:

单次运行的k均值算法的最大迭代次数。

但是我不完全理解那是什么意思。n_init给定初始形心集,形心向点平均移动的次数是多少?

并且是max_iter的次数整个算法与新的初始重心运行?

因此,例如,使用max_iter=2,时n_init=15,kmeans将选择初始质心,然后将这些质心移动15次并得出聚类结果。然后kmeans将再次选择初始质心,将这些质心移动15次,然后停止。然后,它将从两次运行中挑选出最佳的选择吗?

谢谢您的帮助!

[编辑] 还是我在这里的完全相反...?

python k-means scikit-learn

6
推荐指数
1
解决办法
1009
查看次数

InvalidS3ObjectException:无法从 S3 获取对象元数据?

因此,我尝试使用Amazon Textract读取多个 pdf 文件,其中多个页面使用StartDocumentTextDetection以下方法:

client = boto3.client('textract')
textract_bucket = s3.Bucket('my_textract_console-us-east-2')

for s3_file in textract_bucket.objects.all():
    print(s3_file)

    response = client.start_document_text_detection(
        DocumentLocation = {
                "S3Object": {
                    "Bucket": "my_textract_console_us-east-2",
                    "Name": s3_file.key,
                    
                } 
        },
        ClientRequestToken=str(random.randint(1,1e10)))
    print(response)
    break
     
Run Code Online (Sandbox Code Playgroud)

当只是尝试从 检索响应对象时s3,我可以看到它打印出来为:

s3.ObjectSummary(bucket_name='my_textract_console-us-east-2', key='C:\\Users\\My_User\\Documents\\Folder\\Sub_Folder\\Sub_sub_folder\\filename.PDF')
Run Code Online (Sandbox Code Playgroud)

相应地,我s3_file.key稍后将使用它来访问该对象。但我收到以下我无法弄清楚的错误:

InvalidS3ObjectException:调用 StartDocumentTextDetection 操作时发生错误 (InvalidS3ObjectException):无法从 S3 获取对象元数据。检查对象键、区域和/或访问权限。

到目前为止我有:

  1. 从 boto3 会话检查了区域,存储桶和 aws 配置设置均设置为us-east-2
  2. 密钥不能错,我直接从对象响应传递它
  3. 在权限方面,我检查了 IAM 控制台,并将其设置为AmazonS3FullAccessAmazonTextractFullAccess

这里可能出了什么问题?

[编辑]我确实重命名了这些文件,以便它们没有\\,但似乎仍然无法正常工作,这很奇怪..

python amazon-s3 amazon-web-services boto3 amazon-textract

6
推荐指数
1
解决办法
6137
查看次数

如何识别字符串是否是人名?

所以我有一些文本数据被凌乱地解析,因此我得到的名称与实际数据混合在一起。是否有任何类型的包/库可以帮助识别单词是否是名称?(在这种情况下,我将假设以美国/西方/欧洲为中心的名称)

否则,标记此问题的好方法是什么?也许在姓名语料库上训练模型并为数据集中的每个单词分配一个分类?只是不确定解决这个问题的最佳方法/什么样的模型适合,或者解决方案是否已经存在

python nlp

5
推荐指数
1
解决办法
7291
查看次数