小编sfa*_*tor的帖子

从fgets()输入中删除尾随换行符

我试图从用户那里获取一些数据并将其发送到gcc中的另一个函数.代码是这样的.

printf("Enter your Name: ");
if (!(fgets(Name, sizeof Name, stdin) != NULL)) {
    fprintf(stderr, "Error reading Name.\n");
    exit(1);
}

Run Code Online (Sandbox Code Playgroud)

但是,我发现它最后有一个换行符\n.所以,如果我输入John它最终发送John\n.如何删除它\n并发送正确的字符串.

c string gcc newline fgets

sfa*_*tor

2015 03-14

210
推荐指数

5
解决办法

30万
查看次数

在bash中的列中获取唯一值的计数

我有多个列分隔的制表符分隔文件.我想计算文件夹中所有文件的列中不同值的出现频率,并按递减顺序对它们进行排序(最高计数优先).如何在Linux命令行环境中完成此操作？

它可以使用任何常见的命令行语言,如awk,perl,python等.

bash command-line frequency

sfa*_*tor

lucky-day

89
推荐指数

4
解决办法

12万
查看次数

R和SPSS的区别

我将很快分析大量的网络流量相关数据,并将对数据进行预处理以进行分析.我发现R和SPSS是最流行的统计分析工具之一.我还将生成相当多的图形和图表.因此,我想知道这两个软件之间的基本区别是什么.

我不是问哪个更好,而只是想知道两者之间的工作流程有什么不同(除了SPSS有GUI之外).无论如何,我将主要使用脚本,所以我想了解其他差异.

statistics r spss data-analysis

sfa*_*tor

2017 04-04

36
推荐指数

5
解决办法

7万
查看次数

如何计算制表符分隔的文本文件中字段的唯一值的数量？

我有一个文本文件,其中包含大量数据,并以制表符分隔.我想查看数据,以便我可以在列中看到唯一值.例如,

Red     Ball 1 Sold
Blue    Bat  5 OnSale
...............

Run Code Online (Sandbox Code Playgroud)

所以,它就像第一列有颜色一样,所以我想知道该列中有多少不同的唯一值,我希望能够为每一列做到这一点.

我需要在Linux命令行中执行此操作,因此可能使用一些bash脚本,sed,awk或其他东西.

附录:感谢大家的帮助,我可以再问一件事吗？如果我想要计算这些独特的价值怎么办？

我想我没有清楚地说明第二部分.我想要做的是计算这些唯一值的"每个",不知道有多少独特的值.例如,在第一列中我想知道有多少红色,蓝色,绿色等彩色物体.

linux bash command-line

sfa*_*tor

2010 08-17

35
推荐指数

3
解决办法

11万
查看次数

如何将日期时间列舍入到最接近的四分之一小时

我已将数据文件加载到Python pandas数据帧中.我有一个格式的日期时间列2015-07-18 13:53:33.280.

我需要做的是创建一个新的列,将其四舍五入到最接近的四分之一小时.因此,上述日期将四舍五入为2015-07-18 13:45:00.000.

我怎么在熊猫里这样做？我尝试使用此处的解决方案,但收到'Series' object has no attribute 'year'错误.

python datetime python-datetime pandas

sfa*_*tor

2017 05-23

33
推荐指数

4
解决办法

3万
查看次数

如何将一些列作为json展平pandas数据帧？

我有一个df从数据库加载数据的数据框.大多数列都是json字符串,而有些列甚至是jsons列表.例如:

id     name     columnA                               columnB
1     John     {"dist": "600", "time": "0:12.10"}    [{"pos": "1st", "value": "500"},{"pos": "2nd", "value": "300"},{"pos": "3rd", "value": "200"}, {"pos": "total", "value": "1000"}]
2     Mike     {"dist": "600"}                       [{"pos": "1st", "value": "500"},{"pos": "2nd", "value": "300"},{"pos": "total", "value": "800"}]
...

Run Code Online (Sandbox Code Playgroud)

如您所见,并非所有行在列的json字符串中具有相同数量的元素.

我需要做的是保持正常的列像它一样,id并name像这样平整json列:

id    name   columnA.dist   columnA.time   columnB.pos.1st   columnB.pos.2nd   columnB.pos.3rd     columnB.pos.total
1     John   600            0:12.10        500               300               200                 1000 
2     Mark   600            NaN            500               300               Nan                 800

Run Code Online (Sandbox Code Playgroud)

我试过这样使用json_normalize:

from pandas.io.json import json_normalize
json_normalize(df) …

Run Code Online (Sandbox Code Playgroud)

python json flatten dataframe pandas

sfa*_*tor

2018 11-04

23
推荐指数

4
解决办法

2万
查看次数

在R中获得堆积区域图

这个问题是我提出的上一个问题的延续.

现在我有一个案例,其中还有一个带有Prop的类别列.因此,数据集变得像

Hour  Category        Prop2

00     A            25
00     B            59
00     A            55
00     C            5
00     B            50
...
01     C            56
01     B            45
01     A            56
01     B            35
...
23     D            58
23     A            52
23     B            50
23     B            35
23     B            15

Run Code Online (Sandbox Code Playgroud)

在这种情况下,我需要在R中制作堆积区域图,每天的这些不同类别的百分比.所以,结果就像.

        A         B       C        D
00     20%       30%     35%       15% 
01     25%       10%     40%       25%
02     20%       40%     10%       30% 
.
.
.
20 
21
22     25%       10%     30% …

Run Code Online (Sandbox Code Playgroud)

plot r ggplot2 reshape stacked-area-chart

sfa*_*tor

2017 05-23

21
推荐指数

2
解决办法

3万
查看次数

在gnuplot中的集群条形图

我有一个简单的结果表,我想在gnuplot中绘制为聚类直方图.数据集具有网页的内容类型类别以及两列中的相应百分比份额.我有两个浏览器.例如,

For IE,
    Content      Share
    Video         30%
    Audio         10%
    Flash         25%
    HTML          20%
    Javascript    15%

   For Chrome,
    Content      Share
    Video         20%
    Audio         5%
    Flash         35%
    HTML          30%
    Javascript    10%

Run Code Online (Sandbox Code Playgroud)

现在我想将这两个数据与x轴中的内容类型以及带有图例的y轴上的相应共享一起绘制.我该怎么做呢？

plot gnuplot bar-chart

sfa*_*tor

lucky-day

20
推荐指数

1
解决办法

2万
查看次数

用python替换Matlab

我是一名工科学生,我必须做很多数值处理,绘图,模拟等工具.我目前使用的工具是Matlab.我在大学的计算机上使用它来完成大部分作业.但是,我想知道有哪些免费选项.

我做了一些研究,很多人都说python在各种场景下都是matlab的有效替代品.我想知道如何用python做这一切.我正在使用mac,所以我如何安装不同的python包.那些包裹是什么？它真的是一个可行的选择吗？使用这个python设置我可以做什么和不能做什么？

python matlab

sfa*_*tor

2009 11-22

17
推荐指数

3
解决办法

1万
查看次数

在bash中排序

我一直在尝试在bash中的制表符分隔文件的每一列中获取唯一值.所以,我使用了以下命令.

cut -f <column_number> <filename> | sort | uniq -c

Run Code Online (Sandbox Code Playgroud)

它工作正常,我可以在列中获取唯一值,它的计数就像

105 Linux
55  MacOS
500 Windows

Run Code Online (Sandbox Code Playgroud)

我想要做的不是按列值名称(在本例中是操作系统名称)进行排序,我想按计数对它们进行排序,并且可能在此输出格式的第二列中有计数.所以它必须看起来像:

Windows 500
MacOS   105
Linux   55

Run Code Online (Sandbox Code Playgroud)

我该怎么做呢？

linux bash shell command-line

sfa*_*tor

lucky-day

17
推荐指数

1
解决办法

6万
查看次数

标签统计

bash ×3

command-line ×3

python ×3

linux ×2

pandas ×2

plot ×2

r ×2

bar-chart ×1

c ×1

data-analysis ×1

dataframe ×1

datetime ×1

fgets ×1

flatten ×1

frequency ×1

gcc ×1

ggplot2 ×1

gnuplot ×1

json ×1

matlab ×1

newline ×1

python-datetime ×1

reshape ×1

shell ×1

spss ×1

stacked-area-chart ×1

statistics ×1

string ×1

标签 统计

小编sfa_tor的帖子

标签统计