production SAL

501-550 of 10000 results (135ms)

2026-07-20 §
17:37	<btullis@deploy2003>	helmfile [dse-k8s-eqiad] START helmfile.d/dse-k8s-services/airflow-main: apply	[production]
17:37	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2244', diff saved to https://phabricator.wikimedia.org/P94923 and previous config saved to /var/cache/conftool/dbconfig/20260720-173709-cwilliams.json	[production]
17:35	<jhancock@cumin2002>	START - Cookbook sre.dns.netbox	[production]
17:31	<bking@deploy2003>	Finished deploy [wdqs/wdqs@e8fb00c]: T430880 (duration: 20m 40s)	[production]
17:31	<sukhe@cumin1003>	cookbooks.sre.cdn.roll-reboot finished rebooting cp2055.codfw.wmnet	[production]
17:30	<sukhe@cumin1003>	cookbooks.sre.cdn.roll-reboot finished rebooting cp2056.codfw.wmnet	[production]
17:27	<bking@cumin2003>	END (PASS) - Cookbook sre.hosts.move-vlan (exit_code=0) for host wdqs1011	[production]
17:27	<bking@cumin2003>	START - Cookbook sre.hosts.move-vlan for host wdqs1011	[production]
17:27	<bking@cumin2003>	START - Cookbook sre.hosts.reimage for host wdqs1011.eqiad.wmnet with OS bookworm	[production]
17:27	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2244', diff saved to https://phabricator.wikimedia.org/P94922 and previous config saved to /var/cache/conftool/dbconfig/20260720-172701-cwilliams.json	[production]
17:16	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2244 (T431660)', diff saved to https://phabricator.wikimedia.org/P94921 and previous config saved to /var/cache/conftool/dbconfig/20260720-171653-cwilliams.json	[production]
17:11	<bking@deploy2003>	Started deploy [wdqs/wdqs@e8fb00c]: T430880	[production]
17:11	<bking@deploy2003>	Finished deploy [wdqs/wdqs@e8fb00c]: T430880 (duration: 13m 03s)	[production]
17:10	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Depooling db2244 (T431660)', diff saved to https://phabricator.wikimedia.org/P94920 and previous config saved to /var/cache/conftool/dbconfig/20260720-171012-cwilliams.json	[production]
17:10	<cwilliams@cumin1003>	DONE (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 1 day, 0:00:00 on db2244.codfw.wmnet with reason: Maintenance	[production]
17:09	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2243 (T431660)', diff saved to https://phabricator.wikimedia.org/P94919 and previous config saved to /var/cache/conftool/dbconfig/20260720-170941-cwilliams.json	[production]
16:59	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2243', diff saved to https://phabricator.wikimedia.org/P94918 and previous config saved to /var/cache/conftool/dbconfig/20260720-165933-cwilliams.json	[production]
16:58	<bking@deploy2003>	Started deploy [wdqs/wdqs@e8fb00c]: T430880	[production]
16:58	<bking@cumin2003>	END (FAIL) - Cookbook sre.elasticsearch.rolling-operation (exit_code=99) Operation.REBOOT (3 nodes at a time) for ElasticSearch cluster search_codfw: apply security updates - bking@cumin2003 - T431826	[production]
16:52	<sukhe@cumin1003>	cookbooks.sre.cdn.roll-reboot finished rebooting cp2053.codfw.wmnet	[production]
16:51	<sukhe@cumin1003>	cookbooks.sre.cdn.roll-reboot finished rebooting cp2054.codfw.wmnet	[production]
16:49	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2243', diff saved to https://phabricator.wikimedia.org/P94917 and previous config saved to /var/cache/conftool/dbconfig/20260720-164926-cwilliams.json	[production]
16:39	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2243 (T431660)', diff saved to https://phabricator.wikimedia.org/P94916 and previous config saved to /var/cache/conftool/dbconfig/20260720-163918-cwilliams.json	[production]
16:35	<bking@cumin2003>	END (FAIL) - Cookbook sre.hosts.reimage (exit_code=99) for host wdqs1023.eqiad.wmnet with OS bookworm	[production]
16:31	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Depooling db2243 (T431660)', diff saved to https://phabricator.wikimedia.org/P94915 and previous config saved to /var/cache/conftool/dbconfig/20260720-163140-cwilliams.json	[production]
16:31	<cwilliams@cumin1003>	DONE (PASS) - Cookbook sre.hosts.downtime (exit_code=0) for 1 day, 0:00:00 on db2243.codfw.wmnet with reason: Maintenance	[production]
16:31	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2242 (T431660)', diff saved to https://phabricator.wikimedia.org/P94914 and previous config saved to /var/cache/conftool/dbconfig/20260720-163111-cwilliams.json	[production]
16:27	<btullis@deploy2003>	helmfile [dse-k8s-codfw] DONE helmfile.d/admin 'apply'.	[production]
16:27	<btullis@deploy2003>	helmfile [dse-k8s-codfw] START helmfile.d/admin 'apply'.	[production]
16:23	<bking@cumin2003>	END (PASS) - Cookbook sre.hosts.move-vlan (exit_code=0) for host wdqs2020	[production]
16:23	<bking@cumin2003>	END (PASS) - Cookbook sre.network.configure-switch-interfaces (exit_code=0) for host wdqs2020	[production]
16:21	<bking@cumin2003>	START - Cookbook sre.network.configure-switch-interfaces for host wdqs2020	[production]
16:21	<bking@cumin2003>	END (PASS) - Cookbook sre.dns.wipe-cache (exit_code=0) wdqs2020.codfw.wmnet 85.0.192.10.in-addr.arpa 5.8.0.0.0.0.0.0.2.9.1.0.0.1.0.0.1.0.1.0.0.6.8.0.0.0.0.0.0.2.6.2.ip6.arpa on all recursors	[production]
16:21	<bking@cumin2003>	START - Cookbook sre.dns.wipe-cache wdqs2020.codfw.wmnet 85.0.192.10.in-addr.arpa 5.8.0.0.0.0.0.0.2.9.1.0.0.1.0.0.1.0.1.0.0.6.8.0.0.0.0.0.0.2.6.2.ip6.arpa on all recursors	[production]
16:21	<bking@cumin2003>	END (PASS) - Cookbook sre.dns.netbox (exit_code=0)	[production]
16:21	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2242', diff saved to https://phabricator.wikimedia.org/P94913 and previous config saved to /var/cache/conftool/dbconfig/20260720-162103-cwilliams.json	[production]
16:19	<btullis@deploy2003>	helmfile [dse-k8s-eqiad] DONE helmfile.d/admin 'apply'.	[production]
16:18	<btullis@deploy2003>	helmfile [dse-k8s-eqiad] START helmfile.d/admin 'apply'.	[production]
16:18	<bking@cumin2003>	START - Cookbook sre.dns.netbox	[production]
16:18	<bking@cumin2003>	END (FAIL) - Cookbook sre.dns.netbox (exit_code=99)	[production]
16:17	<jhancock@cumin2002>	END (PASS) - Cookbook sre.dns.netbox (exit_code=0)	[production]
16:17	<jhancock@cumin2002>	END (PASS) - Cookbook sre.puppet.sync-netbox-hiera (exit_code=0) generate netbox hiera data: "Triggered by cookbooks.sre.dns.netbox: updating for netbox accounting errors - jhancock@cumin2002"	[production]
16:17	<jhancock@cumin2002>	START - Cookbook sre.puppet.sync-netbox-hiera generate netbox hiera data: "Triggered by cookbooks.sre.dns.netbox: updating for netbox accounting errors - jhancock@cumin2002"	[production]
16:14	<sukhe@cumin1003>	cookbooks.sre.cdn.roll-reboot finished rebooting cp2051.codfw.wmnet	[production]
16:12	<sukhe@cumin1003>	cookbooks.sre.cdn.roll-reboot finished rebooting cp2052.codfw.wmnet	[production]
16:11	<jhancock@cumin2002>	START - Cookbook sre.dns.netbox	[production]
16:10	<cwilliams@cumin1003>	dbctl commit (dc=all): 'Repooling after maintenance db2242', diff saved to https://phabricator.wikimedia.org/P94912 and previous config saved to /var/cache/conftool/dbconfig/20260720-161055-cwilliams.json	[production]
16:09	<brouberol@deploy2003>	helmfile [dse-k8s-eqiad] DONE helmfile.d/admin 'apply'.	[production]
16:08	<brouberol@deploy2003>	helmfile [dse-k8s-eqiad] START helmfile.d/admin 'apply'.	[production]
16:06	<brouberol@deploy2003>	helmfile [dse-k8s-codfw] DONE helmfile.d/admin 'apply'.	[production]