Azure Functions 的实例正在共享变量吗?

Ale*_*erJ 5 java azure-functions azure-blob-trigger

不确定这个问题是否有意义,但这就是我所观察到的。我的 Azure 函数使用 BlobTrigger 处理上传到 Blob 存储的 PDF 文件。一切正常,直到我一次上传多个 blob,在这种情况下,使用下面的代码我观察到以下内容:

  • 第一个 context.getLogger() 正确记录触发该函数的每个 blob。

  • 在 Azure 文件共享中,每个 PDF 文件都会正确保存。

  • 在许多情况下,第二个 context.getLogger() 返回不正确的结果(来自其他文件之一),就好像变量在我的 Function 实例之间共享一样。请注意,lines[19] 对于每个 PDF 都是唯一的。

  • 我后来在代码中注意到类似的行为,其中记录了来自错误 PDF 的数据。

编辑:需要明确的是,我知道当多个实例并行运行时,日志不会按顺序排列。然而,当我上传 10 个文件时,大多数结果都是重复的,而不是获得行 [19] 的 10 个唯一结果,并且当基于 XI 想做 Y 时,这个问题稍后会在我的代码中恶化,并且 10 次调用中有 9 次产生垃圾数据。

主类

public class main {
   @FunctionName("veninv")
       @StorageAccount("Storage")
       public void blob(
           @BlobTrigger(
                   name = "blob",
                   dataType = "binary",
                   path = "veninv/{name}") 
               byte[] content,
           @BindingName("name") String blobname,
           final ExecutionContext context
           ) {

         context.getLogger().info("BlobTrigger by: " + blobname + "(" + content.length + " bytes)");

           //Writing byte[] to a file in Azure Functions file storage
               File tempfile = new File (tempdir, blobname);
               OutputStream os = new FileOutputStream(tempfile);
               os.write(content);
               os.close();

               String[] lines  = Pdf.getLines(tempfile);
               context.getLogger().info(lines[19]);
           }
    }
Run Code Online (Sandbox Code Playgroud)

pdf.class

   public static String[] getLines(File PDF) throws Exception {
           PDDocument doc = PDDocument.load(PDF);
           PDFTextStripper pdfStripper = new PDFTextStripper();
           String text = pdfStripper.getText(doc);
           lines = text.split(System.getProperty("line.separator"));
           doc.close();
           return lines;
   }
Run Code Online (Sandbox Code Playgroud)

我不太明白这是怎么回事,所以希望得到一些帮助。

Tro*_*eft 5

是的。Azure 函数调用可以共享变量。我需要看到所有代码都是 100% 确定的,但看起来该lines对象被声明为static并且可以在调用之间共享。让我们尝试从 a 更改为static String[]String[]看看问题是否消失?

\n

Azure 函数很容易上手,很容易忘记执行环境。您的函数调用并不像看起来那样孤立。有一个父线程调用您的函数,并且许多静态变量不是“线程安全的”。静态变量代表全局状态,因此可以全局访问。此外,它不附加任何特定的对象实例。变量的“静态性”与它所在的内存空间有关,而不是与它\xe2\x80\x99s 的值有关。因此,同一个变量可以从引用它的所有类实例中访问。

\n

附言。您已经通过减少并发性解决了此处答案中的问题,但这可能会牺牲可扩展性。我建议对其进行负载测试。静态变量也很有用。许多都是线程安全的,您希望在 Azure 函数中使用它们,例如 httpClient 或 sqlClient 数据库连接!在这里读一下第三点。

\n