小编ana*_*sso的帖子

如何使用gensim的word2vec模型和python计算句子相似度

根据Gensim Word2Vec,我可以使用gensim包中的word2vec模型来计算2个单词之间的相似度.

例如

trained_model.similarity('woman', 'man') 
0.73723527
Run Code Online (Sandbox Code Playgroud)

但是,word2vec模型无法预测句子相似性.我发现在gensim中具有句子相似性的LSI模型,但是,似乎不能与word2vec模型结合.我所拥有的每个句子的语料库长度不是很长(短于10个单词).那么,有没有简单的方法来实现目标?

python gensim word2vec

113
推荐指数
10
解决办法
8万
查看次数

unix - 文件中的列数

给定一个包含这样数据的文件(即stores.dat文件)

sid|storeNo|latitude|longitude
2|1|-28.03720000|153.42921670
9|2|-33.85090000|151.03274200
Run Code Online (Sandbox Code Playgroud)

输出列名数的命令是什么?

即在上面的示例中它将是4.(管道字符数+第一行中的1)

我想的是:

awk '{ FS = "|" } ; { print NF}' stores.dat
Run Code Online (Sandbox Code Playgroud)

但它返回所有行而不是第一行,而第一行则返回1而不是4

unix linux bash shell scripting

68
推荐指数
4
解决办法
16万
查看次数

来自地址数组的多个标记Google Map API v3,并在pageLoad上进行地理编码时避免使用OVER_QUERY_LIMIT

我必须从地址数组中实现多标记功能.正在从数据库中提取地址字符串.

我的地址数组看起来像这样

    var address = <?php echo $add_js ?>;
Run Code Online (Sandbox Code Playgroud)

我在互联网上甚至在这个论坛上都经历了很多例子,但在大多数例子中,纬度和经度已经在这些数据库中可用.有没有办法让我使用该地址数组并在谷歌地图上放置多个标记.或解释这种概念的任何例子?!

我从JSFIDDLE中练习了这个例子,但是我没有输出.

       <script>
   var geocoder;
       var map;
       var markersArray = [];

   function initialize() 
    {
        geocoder = new google.maps.Geocoder();

    latlang = geocoder.geocode( { 

           'address': 'New Delhi, India'},                                             

            function(results, status) 
    {  

         if (status == google.maps.GeocoderStatus.OK) 
           {
              map.setCenter(results[0].geometry.location);
              marker = new google.maps.Marker({
              map: map,
              position: results[0].geometry.location
            });
            markersArray.push(marker);

             }
             else
           {
               alert("Geocode was not successful for the following reason: " + status);
                       }
           });

          var myOptions = 
          {
                      center: latlang, zoom: 5, 
          mapTypeId: google.maps.MapTypeId.SATELLITE, …
Run Code Online (Sandbox Code Playgroud)

javascript arrays google-maps google-maps-api-3

29
推荐指数
2
解决办法
12万
查看次数

Hadoop,如何压缩映射器输出但不压缩reducer输出

我有一个map-reduce java程序,我尝试只压缩mapper输出但不压缩reducer输出.我认为这可以通过在Configuration实例中设置以下属性来实现,如下所示.但是,当我运行我的作业时,reducer生成的输出仍然被压缩,因为生成的文件是:part-r-00000.gz.有没有人成功地压缩了映射器数据而不是缩减器?这甚至可能吗?

//压缩映射器输出

conf.setBoolean("mapred.output.compress", true);
conf.set("mapred.output.compression.type", CompressionType.BLOCK.toString());
conf.setClass("mapred.output.compression.codec", GzipCodec.class, CompressionCodec.class);
Run Code Online (Sandbox Code Playgroud)

compression hadoop hdfs

25
推荐指数
3
解决办法
5万
查看次数

DataAnnotation与自定义ResourceProvider

我创建了一个自定义ResourceProvider来从数据库中提取本地化信息.我现在想DataAnnotation用来为模型添加验证.

DataAnnotationhas ErrorMessageResourceTypeErrorMessageResourceName属性但ErrorMessageResourceType只接受System.Type(即编译的资源文件)

有没有办法让DataAnnotation使用自定义ResourceProvider?

c# asp.net-mvc resources localization

19
推荐指数
1
解决办法
7804
查看次数

Spark sql Dataframe - 导入sqlContext.implicits._

我有main创建spark上下文:

    val sc = new SparkContext(sparkConf)
    val sqlContext = new org.apache.spark.sql.SQLContext(sc)
    import sqlContext.implicits._
Run Code Online (Sandbox Code Playgroud)

然后创建数据帧并对数据帧进行过滤和验证.

    val convertToHourly = udf((time: String) => time.substring(0, time.indexOf(':')) + ":00:00")

    val df = sqlContext.read.schema(struct).format("com.databricks.spark.csv").load(args(0))
    // record length cannot be < 2 
    .na.drop(3)
    // round to hours
    .withColumn("time",convertToHourly($"time"))
Run Code Online (Sandbox Code Playgroud)

这非常有效.

但是当我尝试通过发送数据帧将我的验证移动到另一个文件时

function ValidateAndTransform(df: DataFrame) : DataFrame = {...}
Run Code Online (Sandbox Code Playgroud)

获取Dataframe并进行验证和转换:似乎我需要

 import sqlContext.implicits._
Run Code Online (Sandbox Code Playgroud)

为了避免错误:"value $不是StringContext的成员"在线发生:.withColumn("time",convertToHourly($ "time"))

但要使用 import sqlContext.implicits._ 我还需要sqlContext在新文件中定义,如下所示:

val sc = new SparkContext(sparkConf)
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
Run Code Online (Sandbox Code Playgroud)

或发送给

function ValidateAndTransform(df: DataFrame) : DataFrame = …
Run Code Online (Sandbox Code Playgroud)

apache-spark-sql spark-dataframe

14
推荐指数
1
解决办法
2万
查看次数

如何在Windows 7中使用代理后面的sbt?

我试图SBTWindows 7上运行.为此,我按照类似线程" 如何从代理后面使用sbt? "中的步骤进行操作.

我有以下相关的"系统变量":

变量名称: JAVA_OPTS 变量值: -Dhttp.proxySet=true -Dhttp.proxyHost=192.168.0.150 -Dhttp.proxyPort=8080

变量名称: SBT_OPTS 变量值: -Dhttp.proxySet=true -Dhttp.proxyHost=192.168.0.150 -Dhttp.proxyPort=8080

变量名称: SBT_HOME 变量值: C:\Program Files (x86)\sbt\

我也改变了内容 C:\Program Files (x86)\sbt\conf\sbtconfig.txt

*****sbtconfig.txt开始*****

*将java args设置为高

-Xmx512M

-XX:MaxPermSize参数=256米

-XX:ReservedCodeCacheSize =128米

*设置额外的SBT选项

-Dsbt.log.format =真

*设置代理

-Dhttp.proxySet =真

-Dhttp.proxyHost = 192.168.0.150

-Dhttp.proxyPort = 8080

*****sbtconfig.txt结束*****

cmd.exe我输入sbt.cmd回声

获取org.fusesource.jansi jansi 1.11 ....

大约1分钟后,我收到很多警告和错误,如:

[...]

::::错误服务器访问错误:连接超时:connect url = https://repo.typesafe.com/typesafe/ivy-releases/org.fusesource.jansi/jansi/1.11.ivys/ivy.xml

[...]

这与我没有代理设置完全相同.当我在浏览器中输入上述地址时,我感到很惊讶,我得到的是:

*****浏览器显示BEGINNING*****

{

"错误":[{

"身份":404,

"消息":"找不到文件."

}]

}

*****浏览器显示END*****

如何判断SBT是否尝试使用代理,还是存在其他问题?

http-proxy windows-7 sbt

9
推荐指数
1
解决办法
2万
查看次数

在LINQ中使用sum方法

我试图总结泛型集合中的值,我使用相同的确切代码在我的代码的其他部分执行此函数但似乎有ulong数据类型的问题?

代码

   Items.Sum(e => e.Value); 
Run Code Online (Sandbox Code Playgroud)

有以下错误:

错误15以下方法或属性之间的调用不明确:' System.Linq.Enumerable.Sum<System.Collections.Generic.KeyValuePair<int,ulong>>(System.Collections.Generic.IEnumerable<System.Collections.Generic.KeyValuePair<int,ulong>>, System.Func<System.Collections.Generic.KeyValuePair<int,ulong>,float>)'和' System.Linq.Enumerable.Sum<System.Collections.Generic.KeyValuePair<int,ulong>>(System.Collections.Generic.IEnumerable<System.Collections.Generic.KeyValuePair<int,ulong>>, System.Func<System.Collections.Generic.KeyValuePair<int,ulong>,decimal?>)

public class Teststuff : BaseContainer<int, ulong, ulong>
{
    public decimal CurrentTotal { get { return Items.Sum(e => e.Value); } }

    public override void Add(ulong item, int amount = 1)
    {
    }

    public override void Remove(ulong item, int amount = 1)
    {
    }
}

public abstract class BaseContainer<T, K, P>
{
    /// <summary>
    /// Pass in the owner of this container.
    /// </summary>
    public …
Run Code Online (Sandbox Code Playgroud)

.net c# linq generics

8
推荐指数
2
解决办法
4267
查看次数

map.setCenter()函数无法正常工作

这是代码......

<script src="http://maps.google.com/maps/api/js?sensor=false"></script>
<script>
var geocoder;
var map;

function initialize() {
    geocoder = new google.maps.Geocoder();        
    var address = "new delhi";

    geocoder.geocode( { 'address': address}, function(results, status) {
        if (status == google.maps.GeocoderStatus.OK) {        
            var latitude = results[0].geometry.location.lat();
            var longitude = results[0].geometry.location.lng();
            alert(latitude);
            alert(longitude);
            map.setCenter(new GLatLng(latitude, longitude));

            var marker = new google.maps.Marker({
                map: map,
                position: results[0].geometry.location
            });
            var latlng = new google.maps.LatLng(latitude, longitude);
            var mapOptions = {
                zoom: 8,
                center: latlng,
                mapTypeId: google.maps.MapTypeId.ROADMAP
            }
            map = new google.maps.Map(document.getElementById('map-canvas'), mapOptions);
        } 
    });
    google.maps.event.addDomListener(window, …
Run Code Online (Sandbox Code Playgroud)

javascript google-maps google-maps-api-3

7
推荐指数
1
解决办法
5万
查看次数

执行失败:您无权调用getProjectTriggers

我是Javascript和谷歌应用程序的新手,但慢慢找到我的脚(帮助)

我编写了一个脚本来执行各种操作,这个脚本的一部分是安装触发器.这里是.

function setTrigger() { 
var ss = SpreadsheetApp.getActive();
var triggers = ScriptApp.getProjectTriggers();
Logger.log('Amount of triggers ' +triggers.length);


var j = 0;
for (var i = 0 ; i < triggers.length;i++){

if(triggers[i].getHandlerFunction() == 'getNotes' ){j++;}

}

Logger.log('Amount of matching triggers ' +j);

if(j == 0 ){ScriptApp.newTrigger("getNotes").forSpreadsheet(ss).onFormSubmit().create();} 
}
Run Code Online (Sandbox Code Playgroud)

这是我遇到的问题.

上面的代码在onOpen()触发器中调用.当我打开工作表并检查日志时,我的触发器未安装,我收到以下消息.

Execution failed: You do not have permission to call getProjectTriggers
Run Code Online (Sandbox Code Playgroud)

当我onOpen()手动运行时.触发器已安装.

我目前拥有电子表格,但理想情况下,我想与人分享,触发器安装和工作.

有任何想法吗?

javascript google-sheets google-apps-script

6
推荐指数
1
解决办法
6560
查看次数