如何将字符串拆分为给定的行数?

odi*_*243 11 javascript algorithm line-breaks word-wrap

这是我的问题:

给定一个由空格分隔的单词组成的字符串,如何将其分成N个(大致)偶数长度的字符串,只打破空格?

以下是我从研究中收集的内容:

我开始研究自动换行算法,因为在我看来,这基本上是一个自动换行的问题.然而,到目前为止我发现的大部分内容(并且有很多关于自动换行的内容)假设线的宽度是已知输入,并且线的数量是输出.我想要相反的.

我发现了(非常)一些问题,比如似乎有帮助.但是,他们都把重点放在优化问题上 - 例如,我如何将一个句子分成给定数量的行,同时最大限度地减少行的粗糙度,浪费的空白等等,并以线性方式进行(或NlogN,或其他任何时间.这些问题似乎大多没有答案,因为问题的优化部分相对"难".

但是,我并不关心优化.只要这些线(在大多数情况下)大致均匀,如果解决方案在每个边缘情况下都不起作用,或者不能证明是最不复杂的时间,我就没问题.我只需要一个真正的世界解决方案,它可以采用一个字符串和一些行(大于2),然后给我一个通常看起来很均匀的字符串数组.

这就是我想出的: 当N = 3时,我认为我有一个可行的方法.我首先将第一个单词放在第一行,最后一行放在最后一行,然后迭代地在第一行和最后一行放置另一个单词,直到我的总宽度(通过最长行的长度测量)停止变短.这通常有效,但如果你最长的单词在行的中间,它会被绊倒,而且对于超过3行似乎不太普遍.

var getLongestHeaderLine = function(headerText) {
  //Utility function definitions
  var getLongest = function(arrayOfArrays) {
    return arrayOfArrays.reduce(function(a, b) {
      return a.length > b.length ? a : b;
    });
  };

  var sumOfLengths = function(arrayOfArrays) {
    return arrayOfArrays.reduce(function(a, b) {
      return a + b.length + 1;
    }, 0);
  };

  var getLongestLine = function(lines) {
    return lines.reduce(function(a, b) {
      return sumOfLengths(a) > sumOfLengths(b) ? a : b;
    });
  };

  var getHeaderLength = function(lines) {
    return sumOfLengths(getLongestLine(lines));
  }

  //first, deal with the degenerate cases
  if (!headerText)
    return headerText;

  headerText = headerText.trim();

  var headerWords = headerText.split(" ");

  if (headerWords.length === 1)
    return headerText;

  if (headerWords.length === 2)
    return getLongest(headerWords);

  //If we have more than 2 words in the header,
  //we need to split them into 3 lines
  var firstLine = headerWords.splice(0, 1);
  var lastLine = headerWords.splice(-1, 1);
  var lines = [firstLine, headerWords, lastLine];

  //The header length is the length of the longest
  //line in the header. We will keep iterating
  //until the header length stops getting shorter.
  var headerLength = getHeaderLength(lines);
  var lastHeaderLength = headerLength;
  while (true) {
    //Take the first word from the middle line,
    //and add it to the first line
    firstLine.push(headerWords.shift());
    headerLength = getHeaderLength(lines);
    if (headerLength > lastHeaderLength || headerWords.length === 0) {
      //If we stopped getting shorter, undo
      headerWords.unshift(firstLine.pop());
      break;
    }
    //Take the last word from the middle line,
    //and add it to the last line
    lastHeaderLength = headerLength;
    lastLine.unshift(headerWords.pop());
    headerLength = getHeaderLength(lines);
    if (headerLength > lastHeaderLength || headerWords.length === 0) {
      //If we stopped getting shorter, undo
      headerWords.push(lastLine.shift());
      break;
    }
    lastHeaderLength = headerLength;
  }

  return getLongestLine(lines).join(" ");
};

debugger;
var header = "an apple a day keeps the doctor away";

var longestHeaderLine = getLongestHeaderLine(header);
debugger;
Run Code Online (Sandbox Code Playgroud)

编辑:我标记了javascript,因为最终我想要一个我可以用该语言实现的解决方案.尽管如此,这对问题并不是非常关键,我会采取任何有效的解决方案.

编辑#2:虽然性能不是我最关心的,但我确实需要能够执行任何我提出的解决方案~100-200次,对于长达250个字符的字符串.这将在页面加载期间完成,因此它不需要永远.例如,我发现尝试通过将每个字符串放入DIV并且使用维度来尝试将此问题卸载到渲染引擎,因为它(似乎)测量渲染元素非常昂贵.

Mil*_*dez 2

尝试这个。对于任何合理的 N,它应该完成以下工作:

function format(srcString, lines) {
  var target = "";
  var  arr =  srcString.split(" ");
  var c = 0;
  var MAX = Math.ceil(srcString.length / lines);
  for (var i = 0, len = arr.length; i < len; i++) {
     var cur = arr[i];
     if(c + cur.length > MAX) {
        target += '\n' + cur;
     c = cur.length;
     }
     else {
       if(target.length > 0)
         target += " ";
       target += cur;
       c += cur.length;
     }       
   }
  return target;
}

alert(format("this is a very very very very " +
             "long and convoluted way of creating " +
             "a very very very long string",7));
Run Code Online (Sandbox Code Playgroud)