小编mel*_*mel的帖子

cassandra,通过非主键选择

我是cassandra的新手,我遇到了一个问题.我创建了一个keypace demodb和一个表用户.该表有3列:id(int和主键),firstname(varchar),name(varchar).这个请求给我带来了好结果:

SELECT * FROM demodb.users WHERE id = 3;

Run Code Online (Sandbox Code Playgroud)

但是这一个:

SELECT * FROM demodb.users WHERE firstname = 'francois';

Run Code Online (Sandbox Code Playgroud)

不起作用,我收到以下错误消息:

InvalidRequest: code=2200 [Invalid query] message="No secondary indexes on the restricted columns support the provided operators: "

Run Code Online (Sandbox Code Playgroud)

此请求也不起作用:

SELECT * FROM users WHERE firstname  = 'francois'  ORDER BY id DESC LIMIT 5;
InvalidRequest: code=2200 [Invalid query] message="ORDER BY with 2ndary indexes is not supported."

Run Code Online (Sandbox Code Playgroud)

提前致谢.

cql cassandra cqlsh

mel*_*mel

2015 04-22

15
推荐指数

2
解决办法

2万
查看次数

如何举办reveal.js演示文稿

我是所有这些Web开发的新手(我只知道在本地做事).我使用reveal.js进行了演示,我希望能够在线看到它(例如我的手机上).我知道我应该主持它,但我真的不知道该怎么做.我尝试使用幻灯片(reveal.js的在线编辑器)来做,但我不能添加脚本和这种东西(我在演示文稿中使用高级图表).如果你能给我一些建议,程序会很好.

hosting web-hosting reveal.js

mel*_*mel

2015 07-01

7
推荐指数

3
解决办法

4677
查看次数

url_for with _external=True 在 heroku 上不会在 URL 上附加服务器名称

我在 Heroku 上部署了一个应用程序，但问题是当我的应用程序发送电子邮件时，它没有在 URL 中附加我的服务器的名称：

content = Content("text/html", verification_email.format(user["first_name"],
                                                             url_for("register.display_register_form",
                                                                     token=token.decode("utf-8"), external=True)))

Run Code Online (Sandbox Code Playgroud)

但是我在电子邮件中收到的链接是：

http:///register_account/DnsJpXw_QIcPYeDHEg_fipB2kRiJBUj2RI6I9cI4Yl4w6K9ohbZRMVqBInuV0aOsBT4Zqt69X8MfhNfnys4s-DAQmgu1OPBwmSQnzAELvdcCyiZtkJGSY8_dQ799FOewtBDkvqR1D8XHmvVxgaVqbwSjdEBnvFsBBHMQCic%3D/verify?external=True

Run Code Online (Sandbox Code Playgroud)

我对这个 URL 有问题：

它不是 https，应该是，因为它是 heroku 上的主机
仅///当服务器名称为空时，服务器名称才不会出现在 URL 中

我该怎么做才能获得正确的 URL https://my-server-name/register_account...？

编辑

我尝试在我的 config.py 文件中设置以下变量：

SERVER_NAME = " http://my-server-58140.herokuapp.com "

它在我的路径中生成了错误，例如我无法访问任何 URL，之前可以访问以下 URL，但在定义我的SERVER_NAME时不再访问它：

http://my-server-58140.herokuapp.com/home

Run Code Online (Sandbox Code Playgroud)

编辑

我的烧瓶应用程序已配置：

SERVER_NAME = os.environ.get('SERVER_NAME')
DEBUG = True
BASE_DIR = os.path.abspath(os.path.dirname(__file__))

Run Code Online (Sandbox Code Playgroud)

在0.0.0.0:5000我的本地主机和：my-server-58140.herokuapp.com在我的生产服务器上将环境变量设置为

python heroku flask python-3.x

mel*_*mel

2017 07-02

7
推荐指数

1
解决办法

1924
查看次数

如何将两个 JSON 文件与 Pandas 合并

我正在尝试执行一个合并 2 个 json 文件的 python 脚本，例如：

第一个文件：students.json

{"John Smith":{"age":16, "id": 1}, ...., "Paul abercom":{"age":18, "id": 764}}

Run Code Online (Sandbox Code Playgroud)

第二个文件：teacher.json

{"Agathe Magesti":{"age":36, "id": 765}, ...., "Tom Ranliver":{"age":54, "id": 801}}

Run Code Online (Sandbox Code Playgroud)

因此，为了不丢失任何信息，我第一次修改文件以添加每个人的状态，如下所示：

{"John Smith":{"age":16, "id": 1, "status":"student"}, ...., "Paul abercom":{"age":18, "id": 764, "status":"student"}}

{"Agathe Magesti":{"age":36, "id": 765, "status":"teacher"}, ...., "Tom Ranliver":{"age":54, "id": 801, "status":"teacher"}}

Run Code Online (Sandbox Code Playgroud)

为此，我执行了以下代码：

import pandas as pd
type_student = pd.read_json('student.json')
type_student.loc["status"] = "student"
type_student.to_json("testStudent.json")
type_teacher = pd.read_json('teacher.json')
type_teacher.loc["status"] = "teacher"
type_teacher.to_json("testTeacher.json")
with open("testStudent.json") as data_file:
   data_student = json.load(data_file)
with open("testTeacher.json") as data_file: …

Run Code Online (Sandbox Code Playgroud)

python json pandas

mel*_*mel

2016 02-06

6
推荐指数

1
解决办法

8340
查看次数

在pyspark中减少数据帧的最有效方法是什么？

我有以下两个数据帧,第一行看起来像:

['station_id', 'country', 'temperature', 'time']
['12', 'usa', '22', '12:04:14']

Run Code Online (Sandbox Code Playgroud)

我想按照'法国'中前100个站点的降序显示平均温度.

在pyspark中实现它的最佳方法(效率最高)是什么？

python apache-spark pyspark

mel*_*mel

lucky-day

6
推荐指数

1
解决办法

6972
查看次数

使用 Flask 从 API 调用端点的正确方法

我正在尝试构建一个 Flask API，我有一个端点应该创建用户，另一个端点应该检查数据库中是否存在用户：

@API.route('/users/', methods=['POST'])
def new_user():
    user_json = json.loads(request.get_json())
    first_name = user_json.get('first_name')
    last_name = user_json.get('last_name')
    email = user_json.get('email')
    password = user_json.get('password')
    # Call the other endpoint here
    if response == 400:
        try:
           user = User(first_name=first_name, last_name=last_name, email=email, password=password)
           db.session.add(user)
           db.session.commit()
           return jsonify(user=user.to_json()), 200
       except:
           return jsonify(error=500), 500
    else:
       return jsonify(user=user.to_json()), 409



@API.route('/users/<string:email>', methods=['GET'])
def is_present(email):
    user = User.query.filter_by(email=email).first()
    if user:
        print(user)
        return jsonify(user=user.to_json()), 200
    else:
        return jsonify(error=404), 404

Run Code Online (Sandbox Code Playgroud)

问题是我不知道is_present在new_user端点中调用我的最佳方法是什么。我应该使用吗requests.get？或者 Flask 中有其他特定的东西可以这样做吗？

python api flask

mel*_*mel

lucky-day

6
推荐指数

1
解决办法

2万
查看次数

升级我的python环境时,'bytes'类型的对象不是JSON可序列化的

我在Flask中开发了一个有效的应用程序.我尝试将我的环境从2.7版升级到3.6版.当我点击正在调用表单的端点时它生成了以下错误:

Traceback (most recent call last):
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1997, in __call__
    return self.wsgi_app(environ, start_response)
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1985, in wsgi_app
    response = self.handle_exception(e)
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1540, in handle_exception
    reraise(exc_type, exc_value, tb)
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/_compat.py", line 33, in reraise
    raise value
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1982, in wsgi_app
    response = self.full_dispatch_request()
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1614, in full_dispatch_request
    rv = self.handle_user_exception(e)
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1517, in handle_user_exception
    reraise(exc_type, exc_value, tb)
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/_compat.py", line 33, in reraise
    raise value
  File "/Users/Melvyn/Documents/personnel/python/TheSwitchWebApp/venv/lib/python3.6/site-packages/flask/app.py", line 1612, …

Run Code Online (Sandbox Code Playgroud)

python versioning flask python-2.7 python-3.x

mel*_*mel

lucky-day

6
推荐指数

1
解决办法

5150
查看次数

Elasticsearch：获取给定文档中每个术语的tf-idf

我在Elasticsearch中有一个具有以下ID的文档：AVosj8FEIaetdb3CXpP-我正在尝试访问tf-idf字段中的每个单词，我做了以下工作：

GET /cnn/cnn_article/AVosj8FEIaetdb3CXpP-/_termvectors
{
  "fields" : ["author_wording"],
  "term_statistics" : true,
  "field_statistics" : true
}'

Run Code Online (Sandbox Code Playgroud)

我得到的答复是：

{
  "_index": "dailystormer",
  "_type": "dailystormer_article",
  "_id": "AVosj8FEIaetdb3CXpP-",
  "_version": 3,
  "found": true,
  "took": 1,
  "term_vectors": {
    "author_wording": {
      "field_statistics": {
        "sum_doc_freq": 3408583,
        "doc_count": 16111,
        "sum_ttf": 7851321
      },
      "terms": {
        "318": {
          "doc_freq": 4,
          "ttf": 4,
          "term_freq": 1,
          "tokens": [
            {
              "position": 121,
              "start_offset": 688,
              "end_offset": 691
            }
          ]
        },
        "742": {
          "doc_freq": 1,
          "ttf": 1,
          "term_freq": 1,
          "tokens": [
            {
              "position": 122,
              "start_offset": 692, …

Run Code Online (Sandbox Code Playgroud)

nlp tf-idf elasticsearch

mel*_*mel

2017 02-14

5
推荐指数

2
解决办法

5666
查看次数

如何绘制 K 均值算法的混淆/相似矩阵

我应用 K-mean 算法使用 scikit learn 对一些文本文档进行分类并显示聚类结果。我想在相似度矩阵中显示我的集群的相似度。我在 scikit 学习库中没有看到任何允许这样做的工具。

# headlines type: <class 'numpy.ndarray'> tf-idf vectors
pca = PCA(n_components=2).fit(headlines)
data2D = pca.transform(to_headlines)
pl.scatter(data2D[:, 0], data2D[:, 1])
km = KMeans(n_clusters=4, init='k-means++', max_iter=300, n_init=3, random_state=0)
km.fit(headlines)

Run Code Online (Sandbox Code Playgroud)

有什么方法/库可以让我轻松绘制这个余弦相似度矩阵？

python matplotlib python-3.x scikit-learn

mel*_*mel

lucky-day

5
推荐指数

1
解决办法

8032
查看次数

在Java与CQL中表示Set

我是cassandra的新手,我尝试将一组数据添加到表中.我的表看起来像:

CREATE TABLE myTable (id int, name varchar, mySet set<uuid>, PRIMARY KEY (id));

Run Code Online (Sandbox Code Playgroud)

我遇到的问题是当我做我的请求时,类型不兼容,Java中的集合的字符串表示是[uuid1,uuid2,...],而cql中的表示是{'uuid1','uuid2', ...}

session.execute("INSERT INTO myTable (id , name, mySet) VALUES (" + myID + ", '" + myName +"' ," + mySet + ");");

Run Code Online (Sandbox Code Playgroud)

所以,如果有一个函数或库可以直接解决这个问题,你知道吗？非常感谢.

java cql cassandra

mel*_*mel

lucky-day

4
推荐指数

1
解决办法

379
查看次数

标签统计

python ×6

flask ×3

python-3.x ×3

cassandra ×2

cql ×2

apache-spark ×1

api ×1

cqlsh ×1

elasticsearch ×1

heroku ×1

hosting ×1

java ×1

json ×1

matplotlib ×1

nlp ×1

pandas ×1

pyspark ×1

python-2.7 ×1

reveal.js ×1

scikit-learn ×1

tf-idf ×1

versioning ×1

web-hosting ×1

标签 统计

小编mel_mel的帖子

标签统计