基础设施团队的后端工程师,将与SRE(Site Reliability Engineers,网站可靠性工程师)一起工作,是经验丰富的Ruby开发者,专注于产品的应用层面的可靠性、可观测性、性能和可扩展性,以及从基础设施角度进行资源优化和对运营相关特性的开发。
我们的可扩展性团队负责通过提升各个GitLab服务及整个应用的可靠性、可用性和性能来优化GitLab.com的性能。预测团队负责预测和投影系统,使开发工程师能够理解他们负责领域的系统增长(计划内和计划外)。我们管理容量规划和错误预算工具和流程。我们还支持框架团队在需要时。最终,这个角色具有巨大的影响力,因为团队与整个工程团队合作解决性能和可用性问题。
GitLab.com 是一个独特的站点,它带来了独特的挑战——它是迄今为止最大的GitLab实例。实际上,它是互联网上最大的单一租户开源SaaS站点之一。我们团队的经验反馈到公司内其他工程团队,以及运行自托管安装的GitLab客户。
如果你符合以下条件,你可能就是这个角色的合适人选:
作为后端工程师,拥有Ruby和/或Ruby on Rails的强大编程技能。
具有分析指标和性能分析的丰富经验
具有使用可观测性工具和监控工具(如Prometheus和Thanos)的丰富经验
有定期与客户互动的经验,并专注于紧急解决他们的请求
能够使用GitLab作为你日常的首选工具
能够理解大型系统——它们的工作原理以及如何在大规模上操作,边缘情况,故障模式,行为
具有异步协作和沟通的经验
有记录一切的冲动,这样你就不需要重复学习相同的事物
拥有热情,积极主动的态度。当你看到某些东西出现问题时,你愿意贡献于修复它
有强烈的行动意识,知道如何快速地通过问题进行迭代
认同我们的价值观,并按照这些价值观工作
如果你具备以下条件,将有额外加分:
有使用Elastic和Kibana的背景
拥有Golang的强编程技能
具有Sidekiq和Redis的经验
对SQL和/或PostgreSQL有良好的知识
从可扩展性团队的问题跟踪器出发,推动所需变更,以可靠地支持GitLab.com规模的GitLab。
改进我们的Prometheus监控或构建新的
该远程工作信息来源于站外平台,本站仅提供部分信息展示与订阅服务,更多请查看免责声明。免责声明