C ++快速排序运行时间

chn*_*net 1 c++ performance quicksort

我有一个关于快速排序算法的问题。我实现了快速排序算法并进行播放。初始未排序数组中的元素是从一定范围内选择的随机数。我发现随机数范围会影响运行时间。例如,从范围(1-2000)中选择的1,000,000个随机数的运行时间需要40秒。如果从范围(1-10,000)中选择1,000,000,则需要9秒。但是我不知道该怎么解释。在课堂上,我们谈论枢轴值可以影响递归树的深度。
对于我的实现,选择数组的最后一个值作为枢轴值。我不使用随机方案来选择枢轴值。

int partition( vector<int> &vec, int p, int r) {

  int x = vec[r];
  int i = (p-1);
  int j = p;
  while(1) {

    if (vec[j] <= x){
      i = (i+1);
      int temp = vec[j];
      vec[j] = vec[i];
      vec[i] = temp;
    }
    j=j+1;
    if (j==r)
      break;
 }
  int temp = vec[i+1];
  vec[i+1] = vec[r];
  vec[r] = temp;
  return i+1;
}

void quicksort ( vector<int> &vec, int p, int r) {

  if (p<r){
    int q = partition(vec, p, r);
    quicksort(vec, p, q-1);
    quicksort(vec, q+1, r);
  }
}

    void random_generator(int num, int * array) {

      srand((unsigned)time(0)); 
      int random_integer; 
      for(int index=0; index< num; index++){ 
        random_integer = (rand()%10000)+1; 
        *(array+index) = random_integer; 
      } 
    }

    int main() {
      int array_size = 1000000;
      int input_array[array_size];
      random_generator(array_size, input_array);
      vector<int> vec(input_array, input_array+array_size);

      clock_t t1, t2;
      t1 = clock();
      quicksort(vec, 0, (array_size - 1));   // call quick sort
      int length = vec.size();
      t2 = clock();
      float diff = ((float)t2 - (float)t1);
      cout << diff << endl;
      cout << diff/CLOCKS_PER_SEC <<endl;
    }
Run Code Online (Sandbox Code Playgroud)

Mar*_*k B 5

很有可能它表现不佳,因为quicksort不能很好地处理很多重复项,并且可能仍然会导致交换它们(不能保证保留键等元素的顺序)。您会注意到,每个数字重复的次数对于10000是100,对于2000是500,而时间因子也是大约5。

您是否对每种规模的平均运行时间平均进行了至少5-10次运行,以使其有一个很好的起点?

作为比较,您检查了std :: sort和std :: stable_sort在相同数据集上的表现如何?

最后,对于这种数据分布(除非是快速排序练习),我认为计数排序会更好-40K内存来存储计数,并在O(n)中运行。