将Visual Studio中的C#Stateful Service Fabric应用程序部署到Linux

ken*_*n2k 6 c# linux azure azure-service-fabric service-fabric-stateful

编辑04/06/18 =>更新了上次状态的问题


所以我有这个工作.Net 4.6状态服务,目前在我部署在Azure上的Windows Service Fabric集群上运行.

从2017年9月开始,我应该可以转到Linux:https://blogs.msdn.microsoft.com/azureservicefabric/2017/09/25/service-fabric-6-0-release/

所以我试图在Linux上部署它,这样我就可以节省成本.

  1. 首先,我将所有代码从.Net 4.6迁移到.Net Core 2.0.现在我可以毫无问题地编译我的二进制文件.我基本上创建了新的.Net Core项目,然后将我的所有源代码从.Net 4.6项目移动到新的.Net Core项目.

  2. 然后我更新了我的Service Fabric应用程序.我从我的sfproj中删除了以前的SF服务,然后我添加了新的.Net Core服务.

在此输入图像描述

看起来有一个警告(虽然输出窗口上没有任何内容),但无论如何,如果我尝试通过Service Fabric Tools 2.0(beta)提供的模板使用.Net core 2.0创建一个新的空Statful服务,它就在这里:

在此输入图像描述

所以我会忍受它.

  1. 在我的开发机器上,我修改了包含我的有状态服务的2个csproj项目,以便它们可以作为Windows可执行文件在本地运行.我用过win7-x64 runtimeIdentifier.

在我的Windows机器上本地运行我的SF群集很好.

  1. 然后我稍微改变了以前用于Linux的csproj文件.我使用的是ubuntu.16.10-x64 runtimeIdentifier.

我还更改了ServiceManifest.xml文件以定位与linux兼容的二进制文件:

  <!-- Code package is your service executable. -->
  <CodePackage Name="Code" Version="1.9.6">
    <EntryPoint>
      <ExeHost>
        <Program>entryPoint.sh</Program>
      </ExeHost>
    </EntryPoint>
  </CodePackage>
Run Code Online (Sandbox Code Playgroud)

entryPoint.sh 是最终执行的基本脚本:

dotnet $DIR/MyService.dll
Run Code Online (Sandbox Code Playgroud)
  1. 然后我从Visual Studio成功部署到我的安全SF Linux集群.不幸的是,我的状态服务有以下错误:

在此输入图像描述

错误事件:SourceId ='System.Hosting',Property ='CodePackageActivation:Code:EntryPoint'.CodePackage激活期间出错.服务主机以退出代码终止:134

看起来我的二进制文件在启动时崩溃了.所以这是我的问题:

  • 从Visual Studio在Linux上部署C#.Net Core SF有状态服务的方法是否正确?

编辑:查看LinuxsyslogVer2v0表,我收到以下错误:

starthost.sh [100041]:未处理的异常:System.IO.FileLoadException:无法加载文件或程序集'System.Threading.Thread,Version = 4.1.0.0,Culture = neutral,PublicKeyToken = b03f5f7f11d50a3a'.定位的程序集的清单定义与程序集引用不匹配.(HRESULT异常:0x80131040)

我发现下面的错误报告:https://github.com/dotnet/sdk/issues/1502 不幸的是,我仍然得到错误,而无需使用的MSBuild(使用dotnet deploy).

编辑:进一步澄清:

  • 我的老板要我在Linux上运行,因为从D1v2机器开始,它的价格是Windows机器的一半(没有许可证等)
  • 我的.NET Core 2.0服务在Windows上成功运行.所以.NET Core端口应该没问题.

ken*_*n2k 5

所以,为了让它正常工作,这是一个真正的痛苦.但它的确有效.好吧,有点儿.


首先,Reliable Services仍然在Linux上进行预览: https ://github.com/Microsoft/service-fabric/issues/71

完整的Linux支持应该很快就会到来(实际上它应该已经根据之前的链接提供了......).

现在有关如何处理的详细信息,这里有一些信息可以帮助其他人,因为在Microsoft文档上没有任何关于它的信息,而且我确实在3天内试图让它工作.

1.为您的项目使用.NET Core 2.0.

它在Linux上受支持.现在预览,但它的工作原理.

2.为项目使用正确的RID.

截至今天(2018年4月),正确使用的RID是ubuntu.16.04-x64.编辑csprojReliable Service项目的文件并设置RID如下:

<Project Sdk="Microsoft.NET.Sdk">

  <PropertyGroup>
    <OutputType>Exe</OutputType>
    <TargetFramework>netcoreapp2.0</TargetFramework>
    <IsServiceFabricServiceProject>True</IsServiceFabricServiceProject>
    <RuntimeIdentifier>ubuntu.16.04-x64</RuntimeIdentifier>
    <Platforms>AnyCPU;x64</Platforms>
  </PropertyGroup>
Run Code Online (Sandbox Code Playgroud)

有趣的是,您应该能够使用RuntimeIdentifiers参数提供多个RID (最后使用S),如下所示:

  <PropertyGroup>
    <OutputType>Exe</OutputType>
    <TargetFramework>netcoreapp2.0</TargetFramework>
    <IsServiceFabricServiceProject>True</IsServiceFabricServiceProject>
    <RuntimeIdentifiers>win7x64;ubuntu.16.04-x64</RuntimeIdentifiers>
    <Platforms>AnyCPU;x64</Platforms>
  </PropertyGroup>
Run Code Online (Sandbox Code Playgroud)

因此,您可以同时构建Windows二进制文件和Linux二进制文件.但它根本行不通.从Visual Studio构建项目时,我最终只得到以下目录:

bin/Debug/netcoreapp2.0/
Run Code Online (Sandbox Code Playgroud)

只有DLL,没有有效的入口点.没有win7-x64文件夹,没有ubuntu.16.04-x64,没有什么.这是一个错误,应该是修复的,但事实并非如此(我使用的Visual Studio 15.6.2至今都是最新版本).请参阅https://github.com/dotnet/core/issues/1039

3.您的服务需要有效的入口点.

在Windows上,它是一个可执行文件(*.exe).在Linux上它不是.我最终获得了Linux C#示例并复制/粘贴了入口点.https://docs.microsoft.com/en-us/azure/service-fabric/service-fabric-create-your-first-linux-application-with-csharp

所以基本上我现在在ServiceManifest.xml每个可靠服务的文件中有以下内容EntryPoint:

<?xml version="1.0" encoding="utf-8"?>
<ServiceManifest Name="XXXX"
                 Version="1.0.0"
                 xmlns="http://schemas.microsoft.com/2011/01/fabric"
                 xmlns:xsd="http://www.w3.org/2001/XMLSchema"
                 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <ServiceTypes>
    <!-- This is the name of your ServiceType.
         This name must match the string used in RegisterServiceType call in Program.cs. -->
    <StatefulServiceType ServiceTypeName="YYY" HasPersistedState="true" />
  </ServiceTypes>

  <!-- Code package is your service executable. -->
  <CodePackage Name="Code" Version="1.0.0">
    <EntryPoint>
      <ExeHost>
        <Program>entryPoint.sh</Program>
      </ExeHost>
    </EntryPoint>
  </CodePackage>
Run Code Online (Sandbox Code Playgroud)

entryPoint.sh 如下:

#!/usr/bin/env bash
check_errs()
{
  # Function. Parameter 1 is the return code
  if [ "${1}" -ne "0" ]; then
    # make our script exit with the right error code.
    exit ${1}
  fi
}

DIR=`dirname $0`
echo 0x3f > /proc/self/coredump_filter
source $DIR/dotnet-include.sh
dotnet $DIR/NAME_OF_YOUR_SERVICE_DLL.dll $@
check_errs $?
Run Code Online (Sandbox Code Playgroud)

dotnet-include.sh 如下:

#!/bin/bash
. /etc/os-release
linuxDistrib=$ID
if [ $linuxDistrib = "rhel" ]; then
  source scl_source enable rh-dotnet20
  exitCode=$?
  if [ $exitCode != 0 ]; then
    echo "Failed: source scl_source enable rh-dotnet20 : ExitCode: $exitCode"
    exit $exitCode
  fi
fi
Run Code Online (Sandbox Code Playgroud)

两者都在PackageRoot文件夹中.我指定了它们的属性,所以它Build Action是" Content"而它Copy to Output Directory是" Copy always".

在此输入图像描述

4.不要使用MSBuild构建!!

是的,它也应该构建Linux软件包,或者至少看起来如此,因为当您右键单击项目并单击"构建"时,MSBuild能够生成以下文件:

在此输入图像描述

不要相信操作的明显成功,在部署时将很难正确执行.一些*.so文件丢失和其他问题.MSBuild是关于依赖关系的地狱和行为不端的错误.

例如,请参阅此错误报告:https://github.com/dotnet/sdk/issues/1502 近一年后仍未修复...

或者https://github.com/dotnet/core/issues/977(也有这个).

5.编写一些PowerShell脚本来自己构建这些东西.

我最后使用以下脚本重新发明轮子来构建我的包:

# Creating binaries for service 1
cd DIRECTORY_OF_MY_SERVICE_1
dotnet publish -c Release -r ubuntu.16.04-x64

# Creating binaries for service 2
cd ..\DIRECTORY_OF_MY_SERVICE_2
dotnet publish -c Release -r ubuntu.16.04-x64

# Creating binaries for service 3
cd ..\DIRECTORY_OF_MY_SERVICE_3
dotnet publish -c Release -r ubuntu.16.04-x64

# Copying ApplicationManifest.xml
cd ..
mkdir PKG\ServiceFabricApplication
echo F|xcopy "ServiceFabricApplication\ApplicationPackageRoot\ApplicationManifest.xml" "PKG\ServiceFabricApplication\ApplicationManifest.xml" /sy

# Copying Service1 files
mkdir "PKG\ServiceFabricApplication\Service1Pkg"
mkdir "PKG\ServiceFabricApplication\Service1Pkg\Code"
xcopy "Service1\PackageRoot\*" "PKG\ServiceFabricApplication\Service1Pkg" /sy /D
xcopy "Service1\bin\Release\netcoreapp2.0\ubuntu.16.04-x64\publish\*" "PKG\ServiceFabricApplication\Service1Pkg\Code" /sy

# Copying Service2 files
mkdir "PKG\ServiceFabricApplication\Service2Pkg"
mkdir "PKG\ServiceFabricApplication\Service2Pkg\Code"
xcopy "Service2\PackageRoot\*" "PKG\ServiceFabricApplication\Service2Pkg" /sy /D
xcopy "Service2\bin\Release\netcoreapp2.0\ubuntu.16.04-x64\publish\*" "PKG\ServiceFabricApplication\Service2Pkg\Code" /sy

# Copying Service3 files
mkdir "PKG\ServiceFabricApplication\Service3Pkg"
mkdir "PKG\ServiceFabricApplication\Service3Pkg\Code"
xcopy "Service3\PackageRoot\*" "PKG\ServiceFabricApplication\Service3Pkg" /sy /D
xcopy "Service3\bin\Release\netcoreapp2.0\ubuntu.16.04-x64\publish\*" "PKG\ServiceFabricApplication\Service3Pkg\Code" /sy

# Compresses the package
Write-host "Compressing package..."
Copy-ServiceFabricApplicationPackage -ApplicationPackagePath .\PKG\ServiceFabricApplication -CompressPackage -SkipCopy
Run Code Online (Sandbox Code Playgroud)

sfprojfile是一个与Visual Studio/MSBuild相关的项目,因此您需要自己构建所有内容.上面的脚本生成的内容与pkg构建sfproj使用Visual Studio 时由MSBuild创建的文件夹相同.它会复制PKG解决方案根目录下的所有文件夹.

包结构详见:https://github.com/MicrosoftDocs/azure-docs/blob/master/articles/service-fabric/service-fabric-package-apps.md

6.现在是时候部署了!

此时我不再信任Visual Studio了,所以我构建了自己的PowerShell脚本:

. .\ServiceFabricApplication\Scripts\Deploy-FabricApplication.ps1 -ApplicationPackagePath '.\PKG\ServiceFabricApplication' -PublishProfileFile '.\ServiceFabricApplication\PublishProfiles\Cloud.xml' -DeployOnly:$false -ApplicationParameter:@{} -UnregisterUnusedApplicationVersionsAfterUpgrade $false -OverrideUpgradeBehavior 'None' -OverwriteBehavior 'SameAppTypeAndVersion' -SkipPackageValidation:$false -ErrorAction Stop
Run Code Online (Sandbox Code Playgroud)

它重用了Deploy-FabricApplication.ps1项目中Service Fabric项目模板提供的脚本sfproj.此脚本解析Cloud.xml PublishProfile并部署到您的服务结构群集.

因此,您在两者上指定权限值PublishProfiles/Cloud.xml,ApplicationParameters/Cloud.xml然后执行脚本.

只有当您拥有用于保护计算机上安装的群集的证书时,它才有效. 请注意第一个点'.' 很重要,因为如果你不使用它,你将有以下错误:

Get-ServiceFabricClusterManifest:群集连接实例为空

请参阅/sf/answers/2667286121/

哦,因为Service Fabric SDK上也有bug,你可能也想关闭你的本地SF集群... https://github.com/Azure/service-fabric-issues/issues/821

7.现在是另一次欺骗的时候了.

它根本不起作用,服务在启动时崩溃.在LinuxsyslogVer2v0Azure存储表(Linux的日志表,位于使用SF集群自动创建的两个Azure存储帐户之一)中搜索数小时后,我发现微软自己的Nuget软件包也有错误.

具体来说,Nuget包Microsoft.Azure.Devices不适用于1.6.0版.引用未找到的DLL或其他问题.我回滚到以前的版本,即1.5.1,它已修复.

在这一点上,我没有更多的精力来创建另一个Github问题.对不起MS,我不是你的QA团队,我累了.

8.使用第一个PowerShell脚本再次构建,使用第二个PowerShell脚本进行部署,然后就完成了.

您最终使用Visual Studio中的.NET Core 2.0(因为它有问题而我使用PowerShell)在Windows上部署了C#Reliable Services到Linux SF Cluster.

现在我的ASP.NET核心服务仍然存在问题,但它将成为另一天的故事.


结论:TL; DR

整件事情一团糟.到处都是虫子.在SDK中,在工具中,在一些Microsoft Nuget包中.糟糕的经历.但它支持(现在预览),你可以使它工作.希望这篇文章能有所帮助......