小编Mar*_*ers的帖子

Python:如何读取和解析unicode utf-8文本文件?

我从Excel导出UTF-8文本,我想使用Python读取和解析传入的数据.我已经阅读了所有在线信息,所以我已经尝试过这个,例如:

 txtFile = codecs.open( 'halout.txt', 'r', 'utf-8' )
 for line in txtFile:
  print repr( line )
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

UnicodeDecodeError:'utf8'编解码器无法解码位置0的字节0xff:意外的代码字节

在Hex编辑器中查看文本文件,第一个值是FFFE我也尝试过:

txtFile.seek( 2 )
Run Code Online (Sandbox Code Playgroud)

在"打开"之后,这只会导致不同的错误.

python xml unicode parsing codec

3
推荐指数
1
解决办法
3545
查看次数

SQL查询 - 20mil记录 - 返回信息的最佳实践

我有一个SQL数据库,其中包含下表:

Table: PhoneRecords
--------------
ID(identity Seed)
FirstName
LastName
PhoneNumber
ZipCode

非常简单的直接表.该表有超过2000万条记录.我正在寻找最好的方法来执行查询,根据表中的区域代码提取记录.例如,这是我已经完成的示例查询.

SELECT phonenumber, firstname
FROM [PhoneRecords]
WHERE (phone LIKE '2012042%') OR
      (phone LIKE '2012046%') OR
      (phone LIKE '2012047%') OR
      (phone LIKE '2012083%') OR
      (phone LIKE '2012088%') OR
      (phone LIKE '2012841%')
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,这是一个丑陋的查询,但它可以完成工作(如果我没有遇到超时问题)

有谁能告诉我速度/优化的最佳方法来执行上述查询以显示结果?目前,上述查询大约需要2个小时才能完成9gb 1600mhz ram,i7 930 quadcore OC'd 4.01ghz.我显然拥有执行此类查询所需的计算机能力,但查询仍然需要很长时间.

sql-server

3
推荐指数
2
解决办法
236
查看次数

Linq:将IEnumerable <Point>转换为IEnumerable <float>

我有一个IEnumerable<Point>,我想将其转换为IEnumerable<float>.

我可以在单个Linq语句中执行此操作吗?

IEnumerable<float> ConvertToPoints(IEnumerable<Point> points)
{
    List<float> floats = new List<float>();
    foreach(var point in points)
    {
        floats.Add(point.X);
        floats.Add(point.Y);
    }
    return floats;
}
Run Code Online (Sandbox Code Playgroud)

c# linq

3
推荐指数
1
解决办法
920
查看次数

如何查看我在MySQL中设置的索引?

我在表上设置了一些索引entries,我想查看它们/列出它们.有办法吗?

mysql database indexing

3
推荐指数
2
解决办法
127
查看次数

在循环中使用Python中的set

我在Python中有以下列表:

[[1, 2], [3, 4], [4, 6], [2, 7], [3, 9]]
Run Code Online (Sandbox Code Playgroud)

我想将它们分组 [[1,2,7],[3,4,6,9]]

我这样做的代码如下所示:

l=[[1, 2], [3, 4], [4, 6], [2, 7], [3, 9]]
lf=[]
for li in l:
    for lfi in lf:
        if lfi.intersection(set(li)):
            lfi=lfi.union(set(li))
            break
    else:
        lf.append(set(li))
Run Code Online (Sandbox Code Playgroud)

如果是我的最终名单.我在l和lf上做了一个循环,当我找到l和lf中的另一个元素之间的交集时,我想合并它们(union)

但我无法弄清楚为什么这不起作用.列表l的第一个元素正在使用append命令插入,但联合不起作用.我的最终名单看起来像[set([1, 2]), set([3, 4])]

它似乎是非常基本的东西,但我不熟悉套装.我感谢任何帮助

谢谢

python dataset

2
推荐指数
1
解决办法
3240
查看次数

c ++欧几里德距离

此代码编译并运行但不输出正确的距离.

for (int z = 0; z < spaces_x; z++)
{
    double dist=( ( (spaces[z][0]-x)^2) + ( (spaces[z][1]-y)^2) );
    dist = abs(dist);   
    dist = sqrt(dist);
    cout << "for x " << spaces[z][0] <<
            " for y " << spaces[z][1] <<
            " dist is  "<< dist << endl;

    if (dist < min_dist)
    {
        min_dist = dist;
        index = z;
    }
}
Run Code Online (Sandbox Code Playgroud)

有谁知道问题可能是什么?

c++

2
推荐指数
3
解决办法
8562
查看次数

无法连接'str'和'list'对象

我得到一个TypeError:无法连接'str'和'list'对象.

我试图从列表中传递一个对象,通过将它与另一个变量连接来创建一个新变量.

示例:我想从组列表中获取值并将其与"All.dbf"连接,以便它对列表中的每个值使用该文件执行某些操作.如果正常工作,它会在每次运行时将dbname的值分别设置为AdministrativeAll.dbf,CadastralAll.dbf和PlanimetericAll.dbf,但是我得到'str'和'list'错误....

group = ['Administrative', 'Cadastral', 'Planimetric']

for i in group:
    dbname = i + "All.dbf"

    blah, blah, blah....
Run Code Online (Sandbox Code Playgroud)

我想我可以将"All.dbf"添加到组列表中的值,但认为必须有更好的方法来处理这个函数或我不知道的事情....任何想法?

干杯

python

2
推荐指数
1
解决办法
8836
查看次数

如果问题有点

以下代码:

<?php
$str = "19.09.02";
if(substr($str, -3, 2) == ".0")
{
    // Doing something
}

$str2 = "19.09.2002";
if(substr($str2, -3, 2) == ".0")
{
    // Doing something
}
?>
Run Code Online (Sandbox Code Playgroud)

为什么第二个语句适用(没有正则表达式)?我怎么解决,它只是应用第一个表达式?

谢谢

php

2
推荐指数
1
解决办法
113
查看次数

如何在Python中将字符串转换为十六进制字符串?

我有一个32位字符的位串,我需要在Python中表示为十六进制.例如,字符串"10000011101000011010100010010111"也需要输出为"83A1A897".

关于如何在Python中最好地解决这个问题的任何建议?

python string binary hex

2
推荐指数
1
解决办法
2万
查看次数

ON DELETE CASCADE无法在MySQL中运行

我使用以下SQL创建一个名为的表 app_info:

CREATE TABLE IF NOT EXISTS `app_info` (
`_id` int(11) NOT NULL AUTO_INCREMENT,
`app_name` varchar(50) DEFAULT NULL,
`app_owner` varchar(50) DEFAULT NULL,
`last_update` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`_id`)
) ENGINE=MyISAM  DEFAULT CHARSET=latin1 AUTO_INCREMENT=6 ;
Run Code Online (Sandbox Code Playgroud)

我使用以下SQL创建一个名为的表tab_info:

CREATE  TABLE `myDB`.`tab_info` (
`_id` INT NOT NULL AUTO_INCREMENT ,
`app_id` INT NOT NULL ,
`tab_title` VARCHAR(15) NOT NULL ,
PRIMARY KEY (`_id`) ,
UNIQUE INDEX `app_id_UNIQUE` (`app_id` ASC) ,
INDEX `app_tab_key` (`app_id` ASC) ,
CONSTRAINT `app_tab_key` …
Run Code Online (Sandbox Code Playgroud)

php mysql

2
推荐指数
1
解决办法
3228
查看次数

标签 统计

python ×4

mysql ×2

php ×2

binary ×1

c# ×1

c++ ×1

codec ×1

database ×1

dataset ×1

hex ×1

indexing ×1

linq ×1

parsing ×1

sql-server ×1

string ×1

unicode ×1

xml ×1