如何告诉 Sentry 不要提醒某些异常?

Sch*_*ern 5 ruby-on-rails sentry ruby-on-rails-5

我有一个 Rails 5 应用程序,它使用raven-ruby向 Sentry 发送异常,然后向我们的 Slack 发送警报。

Raven.configure do |config|
  config.dsn = ENV['SENTRY_DSN']
  config.environments = %w[ production development ]
  config.excluded_exceptions += []
  config.async = lambda { |event|
    SentryWorker.perform_async(event.to_hash)
  }
end

class SentryWorker < ApplicationWorker
  sidekiq_options queue: :default

  def perform(event)
    Raven.send_event(event)
  end
end
Run Code Online (Sandbox Code Playgroud)

我们的 Sidekiq 作业抛出异常并被重试是正常的。这些大多是间歇性的 API 错误和超时,它们会在几分钟内自行清除。Sentry 尽职尽责地向我们的 Slack 发送这些错误警报。

我已经将 加到retry_count了 jobs。如何防止 Sentry 将 retry_count < N 的异常发送到 Slack,同时仍然提醒其他异常?一个不应该被警告的例子会有这样的额外上下文:

sidekiq: {
  context: Job raised exception,
  job: {
    args: [{...}],
    class: SomeWorker,
    created_at: 1540590745.3296254,
    enqueued_at: 1540607026.4979043,
    error_class: HTTP::TimeoutError,
    error_message: Timed out after using the allocated 13 seconds,
    failed_at: 1540590758.4266324,
    jid: b4c7a68c45b7aebcf7c2f577,
    queue: default,
    retried_at: 1540600397.5804272,
    retry: True,
    retry_count: 2
  },
}
Run Code Online (Sandbox Code Playgroud)

根本不将它们发送到 Sentry 与将它们发送到 Sentry 但没有收到警报的优缺点是什么?

Kat*_*ine 8

概括

对我来说效果很好的一个选项是将Sentryshould_capture与 Sidekiq 一起配置sidekiq_retries_exhausted为异常的自定义属性。

细节

1a. 添加自定义属性

您可以向异常添加自定义属性。您可以使用以下命令在任何错误类上定义它attr_accessor

class SomeError
  attr_accessor :ignore

  alias ignore? ignore
end
Run Code Online (Sandbox Code Playgroud)

1b. 修复错误,设置自定义属性,然后重新提升

def perform
  # do something
rescue SomeError => e
  e.ignore = true
  raise e
end
Run Code Online (Sandbox Code Playgroud)
  1. 配置 should_capture

should_capture允许您在异常满足定义的条件时捕获异常。异常被传递给它,您可以在其上访问自定义属性。

config.should_capture { |e| !e.ignore? }

  1. 重试用完时翻转自定义属性

根据所使用的 Sidekiq 版本,有 2 种方法可以定义您希望在作业终止时发生的行为。如果你想全局申请并拥有 sidekiq v5.1+,你可以使用死亡处理程序。如果你想申请某个特定的worker或者v5.1以下的,可以使用sidekiq_retries_exhausted.

sidekiq_retries_exhausted { |_job, ex| ex.ignore = false }


Mar*_*zer 3

如果 retry_count < N (可以在您发布的 sidekiq 工作程序内部完成),您可以过滤掉整个事件。如果不发出警报,您将丢失有关这种情况发生频率的数据,但警报本身不会太吵闹。

class SentryWorker < ApplicationWorker
  sidekiq_options queue: :default

  def perform(event)
    retry_count = event.dig(:extra, :sidekiq, :job, retry_count)
    if retry_count.nil? || retry_count > N
      Raven.send_event(event)
    end
  end
end
Run Code Online (Sandbox Code Playgroud)

另一个想法是根据是否重试来设置不同的指纹。像这样:

class MyJobProcessor < Raven::Processor
  def process(data)
    retry_count = event.dig(:extra, :sidekiq, :job, retry_count)
    if (retry_count || 0) < N
      data["fingerprint"] = ["will-retry-again", "{{default}}"]
    end
  end
end
Run Code Online (Sandbox Code Playgroud)

请参阅https://docs.sentry.io/learn/rollups/?platform=javascript#custom-grouping

我没有对此进行测试,但这应该将您的问题分为两个,具体取决于 sidekiq 是否会重试它们。然后,您可以忽略一组,但仍然可以在需要数据时查看它。