标签: binary-data

什么是文本编码最有效的二进制文件?

到目前为止,我能找到的最接近的竞争者是yEnc(2%)和ASCII85(25%的开销).yEnc似乎存在一些问题,主要是因为它使用的是8位字符集.这引出了另一个想法:是否存在基于UTF-8字符集的二进制文本编码?

binary-data character-encoding

26
推荐指数
5
解决办法
2万
查看次数

vector <unsigned char> vs二进制数据的字符串

哪个是用于保存和访问二进制数据的更好的c ++容器?

std::vector<unsigned char>
Run Code Online (Sandbox Code Playgroud)

要么

std::string
Run Code Online (Sandbox Code Playgroud)

一个比另一个更有效吗?
一个更"正确"的用法吗?

c++ string stl vector binary-data

24
推荐指数
2
解决办法
8910
查看次数

如何在Javascript中编程hex2bin?

我需要在Javascript和PHP之间进行通信(我使用jquery for ajax)但PHP脚本的输出可能包含二进制数据.这就是我bin2hex在PHP中使用函数的原因.然后json_encode应用于PHP端.我不知道的是如何在Javascript端将十六进制字符串转换为二进制数据.

谢谢!

javascript hex binary-data

24
推荐指数
4
解决办法
5万
查看次数

SQL中二进制字符串的汉明距离

我的数据库中有一个表,我将SHA256哈希存储在BINARY(32)列中.我正在寻找一种方法来计算列中条目的汉明距离到提供的值,即:

SELECT * FROM table 
  ORDER BY HAMMINGDISTANCE(hash, UNHEX(<insert supplied sha256 hash here>)) ASC 
  LIMIT 10
Run Code Online (Sandbox Code Playgroud)

(如果您想知道,字符串A和B的汉明距离定义为BIT_COUNT(A^B),其中^是按位XOR运算符,BIT_COUNT返回二进制字符串中的1的数量).

现在,我知道^运算符和BIT_COUNT函数都只能在INTEGER上运行,所以我想说可能唯一的方法就是分解子字符串中的二进制字符串,将每个二进制子字符串转换为整数,计算汉明距离子串,然后添加它们.这个问题是它听起来非常复杂,效率不高,绝对不优雅.因此,我的问题是:你能提出更好的建议吗?(请注意我在共享主机上,因此我无法修改数据库服务器或加载库)

编辑(1):显然在PHP中加载整个表并进行计算是可能的,但我宁愿避免它,因为这个表可能会变得非常大.

编辑(2):数据库服务器是MySQL 5.1

编辑(3):我的答案包含我刚才描述的代码.

编辑(4):我刚刚发现使用4个BIGINT来存储哈希而不是BINARY(32)会产生大量的速度提升(速度提高100倍以上).请参阅下面的评论.

mysql sql hash binary-data hamming-distance

23
推荐指数
1
解决办法
8374
查看次数

如何为R中的数据加载创建进度条?

是否可以使用load()为加载到R中的数据创建进度条?

对于数据分析项目,大型矩阵从.RData文件加载到R中,这需要几分钟才能加载.我想有一个进度条来监控数据加载前的时间.R已集成了很好的进度条功能,但load()没有用于监视已读取数据量的挂钩.如果我不能直接使用负载,是否有间接方式可以创建这样的进度条?也许将.RData文件加载到chucks中并将它们放在一起用于R.是否有人对此有任何想法或建议?

load r file binary-data progress-bar

23
推荐指数
1
解决办法
5044
查看次数

将PDF文件存储为SQL Server中的二进制对象,是或否?

我必须为以下任务找到设计决策:

我有一个SQL Server数据库,它包含一个订单表.用户可以通过从网页上传的简单文件上传PDF文档并将其分配给订单.每个订单不超过一个文档(可能没有文档,从不超过一个).为此,用户打开网页,输入订单号,显示订单并单击上传按钮.所以我知道上传的文件属于哪个顺序.

现在我正在考虑将两种文件存储在Web服务器上的选项:

1)通过varbinary(MAX)列扩展我的订单表,并将PDF文档直接存储到该二进制字段中.

2)将PDF文件保存在磁盘上的特定文件夹中,并为其指定与订单相关的唯一名称(例如,我的订单号是数据库中的主键,或者是我可以存储在其他列中的GUID).订购表).也许我必须将文件存储在子文件夹中,每月一个,并将子文件夹名称存储到数据库的订单行中,以避免在一个文件夹中获取过多的文件.

存储PDF文件后,可以在输入相关订单号后通过浏览器下载和查看.

我倾向于选项(1),因为数据管理似乎更容易让我在一个数据库中拥有所有相关数据.但是我有点担心随着时间的推移我会遇到性能问题,因为我的数据库大小比解决方案(2)增长得快得多.大约90%甚至95%的数据库总大小仅由那些存储的PDF文件组成.

以下是一些其他信息:

  • PDF文件的大小约为100千字节
  • 每月大约1500个订单/ PDF文件
  • Windows Server 2008 R2/IIS 7.5
  • SQL Server 2008 SP1 Express
  • 不太确定硬件,我相信一个QuadCore Proc.和4 GB RAM
  • 应用程序是用ASP.NET Webforms 3.5 SP1编写的

(我知道在使用上述数字大约2年后,我将达到SQL Server Express版本的4GB限制.但我们可以忽略这一点,从数据库中删除旧数据或升级到完整许可证将是可能的选择.)

我的问题是:选项的Pro和Contra是什么,你会推荐什么?也许某人有类似的任务,可以报告他的经历.

提前谢谢你的回复!

有关:

在DB中存储图像 - 是还是不?

sql-server asp.net database-design binary-data

20
推荐指数
1
解决办法
5万
查看次数

如何将整数转换为二进制向量?

如何使用R将整数转换为二进制向量?

例如 :

number <- 11
[1] 1 0 1 1
Run Code Online (Sandbox Code Playgroud)

如果我需要将整个数字向量(最小值= 0,最大值= 300)转换为二进制矩阵,那么最快的转换方法(使用R代码或包中的一些现有函数)是什么?

binary integer r numeric binary-data

20
推荐指数
5
解决办法
4万
查看次数

mysqldump可靠地处理二进制数据吗?

我在MySQL 5.6中有一些表在某些字段中包含大型二进制数据.我想知道我是否可以信任创建的转储,mysqldump并确保在通过FTP,SCP等系统传输转储文件时,这些二进制字段不会轻易损坏.另外,我是否应该强制此类系统将转储文件视为二进制传输而不是ascii?

提前感谢您的任何意见!

mysql mysqldump binary-data

20
推荐指数
2
解决办法
1万
查看次数

Ricoh Theta S - 在javascript中实时预览

我正在尝试使用HTTP请求创建一个与Ricoh Theta S相机对话的应用程序......它们符合Open Spherical Camera API Version 1.0 ... 这是他们的api参考

所以我试图实现他们说相机支持的实时预览 ......我在javascript中这样做,所以我尝试了每个可能的组合来获取他们说api调用返回的二进制数据...尝试了vanilla js,jquery,angular ......没有......这是请求的打印屏幕......虽然状态代码是200,但调试器显示为红色

在此输入图像描述

响应是空的...所以我的问题是......有没有办法可以通过HTTP在javascript中使用发送对象的POST请求实现Motion JPEG(10 fps)?

谢谢,雷尔斯

javascript ajax camera binary-data

20
推荐指数
1
解决办法
804
查看次数

Fortran未格式化的文件格式

我不明白fortran中未格式化文件的格式.

例如:

open (3,file=filename,form="unformatted",access="sequential")
write(3) matrix(i,:)
Run Code Online (Sandbox Code Playgroud)

将矩阵列输出到文件中.我发现它在两端填充了4个字节的文件,但是我真的不明白为什么,或者如何控制这种行为.有没有办法删除填充?

谢谢

fortran binaryfiles binary-data

19
推荐指数
3
解决办法
3万
查看次数