Affirm的基础设施平台团队正在构建一个大规模、高度分布式、容错的全球基础设施,该基础设施被多个金融产品、商家和供应商共享。确保我们的基础设施对工程师公开可用是Affirm成功故事的关键部分。我们自豪于我们的文化,涵盖工程设计、架构和编写详细的技术规范,并在系统大变更前捕捉反馈。 我们正在寻找一位具有深厚技术知识、对Linux、网络主题、微服务和分布式架构充满热情,并且具有处理大规模服务经验的**高级网站可靠性工程师**加入我们的网站可靠性工程团队。我们的目标是使Affirm的全球服务导向架构产品和基础设施堆栈可观察、高度弹性、可扩展和容错,同时保持我们的高SLA正常运行时间预期。如果您对深入挖有热情,并且在技术沟通、优先级排序和组织方面有敏锐的洞察力,您将表现出色。您将直接与我们的平台/基础设施和产品开发团队合作,构建我们的下一代“始终在线”的基于云的平台。 我们的工作范围从可观察性/遥测工程、可靠性和可扩展性工程、混沌工程、性能工程、容量工程和灾难恢复工程,以及与安全团队紧密合作管理应用级安全。 网站可靠性工程师是混合系统、软件、数据和网络工程师,负责构建和扩展可靠的系统,以给客户留下深刻印象。 **您将做什么** - 负责关键任务服务的端到端可用性、可靠性和性能 - 排查可靠性、弹性、可扩展性和可用性的各种问题 - 定义和衡量SLI、SLA和SLO - 增强仪器化,构建具有特殊关注故障点的一致性依赖映射 - 构建命令和控制自动化,以快速故障转移,减少TTR并减少手动工作/消除Toil - 协助值班和分诊轮转 **我们寻找的** - Linux、网络和AWS经验 - 容器化和容器平台经验(例如,Docker、Kubernetes) - 熟悉Elasticsearch、Kibana/Grafana、Logstash、kafka及其扩展方式 - 具有自动化系统(ansible、puppet、terraform)经验者优先,首选saltstack - 具有开源系统经验者优先 - 具有Python/Kotlin/Go软件开发经验者优先 - 具有高性能网络(Quic、网络层优化)或实时事务协议/方法(HTTP2、服务器发送事件、MQTT、WebSockets)经验者优先 - 推荐或帮助架构整个系统。作为专家,理解和执行TCP转储、snoop和其他网络嗅探器。理解和应用大多数协议(TCP/IP、HTTP、UDP等)的知识 **美国太平洋基本工资范围(CA、WA、NY、NJ、CT):** - $190,000-$284,900 **蓝宝石基本工资范围(所有其他美国州):** - $171,000-$256,500
该远程工作信息来源于站外平台,本站仅提供部分信息展示与订阅服务,更多请查看免责声明。