我的数据包含连续和分类功能的混合.下面是我的数据在csv格式中的一小部分(将其视为由在不同城市运营商店的超级商店链收集的数据)
city,avg_income_in_city,population,square_feet_of_store_area, store_type ,avg_revenue
NY ,54504 , 3506908 ,3006 ,INDOOR , 8000091
CH ,44504 , 2505901 ,4098 ,INDOOR , 4000091
HS ,50134 , 3206911 ,1800 ,KIOSK , 7004567
NY ,54504 , 3506908 ,1000 ,KIOSK , 2000091
Run Code Online (Sandbox Code Playgroud)
她可以看到avg_income_in_city,square_feet_of_store_area和avg_revenue是连续值,其中city,store_type等是分类类(还有一些我没有在这里展示以保持数据的简洁性).
我希望对数据建模以预测收入.问题是如何使用sklearn"离散"连续值?sklearn是否为连续值的离散化提供了任何"现成的"类/方法?(就像我们在Orange中一样,例如Orange.Preprocessor_discretize(data,method = orange.EntropyDiscretization())
谢谢 !
我在文件中有这个代码scr.sh:
#!/bin/sh
string='ps -e | less'
$string
Run Code Online (Sandbox Code Playgroud)
当我执行这个脚本时,它不起作用.为什么?我应该怎么做才能从shell脚本中的字符串变量执行命令?
在 x 轴中添加字符串值时,莫里斯面积图会中断,并显示以下错误:
错误:属性 d:预期的移动路径命令('M' 或 'm'),“Z”。
错误:属性 d:预期数字,“M,0,0”。
Morris.Area({
element: 'area-example',
data: [
{ y: 'Jan', a: 10},
{ y: 'Feb', a: 20},
{ y: 'Mar', a: 30},
{ y: 'Apr', a: 40},
{ y: 'May', a: 50},
{ y: 'Jun', a: 60}
],
xkey: 'y',
ykeys: ['a'],
labels: ['Series A']
});
Run Code Online (Sandbox Code Playgroud)
开箱即用的莫里斯库不支持吗?
我试图从控制台获取一个字符串,并将所有元素放在一个int数组中.它抛出一个错误,我的输入格式错误.我正在尝试"1 1 3 1 2 2 0 0",我需要那些作为int值,然后用它们执行一些计算.
这是我的尝试:
class Program
{
static void Main()
{
string first = Console.ReadLine();
string[] First = new string[first.Length];
for (int i = 0; i < first.Length; i++)
{
First[i] += first[i];
}
int[] Arr = new int[First.Length];//int array for string console values
for (int i = 0; i < First.Length; i++)//goes true all elements and converts them into Int32
{
Arr[i] = Convert.ToInt32(First[i].ToString());
}
for (int i = 0; i < Arr.Length; i++)//print …Run Code Online (Sandbox Code Playgroud)