analytics SAL

1901-1950 of 6077 results (32ms)

2021-11-08 §
19:44	<razzi>	create admin user on an-coord1001 for T284150	[analytics]
18:07	<razzi>	run `create user 'admin'@'localhost' identified by <password>; grant all privileges on . to admin;` to allow milimetric to access mysql on an-coord1002 for T284150	[analytics]
2021-11-04 §
16:39	<razzi>	add "can sql json on superset" permission to Alpha role on superset.wikimedia.org	[analytics]
16:14	<razzi>	drop and restore superset_staging database to test permissions as they are in production	[analytics]
2021-11-03 §
17:07	<razzi>	razzi@an-tool1010:~$ sudo systemctl stop superset	[analytics]
16:57	<razzi>	dump mysql in preparation for superset upgrade	[analytics]
02:23	<milimetric>	deployed refinery with regular train	[analytics]
2021-10-29 §
23:04	<btullis>	deleted all remaining old cassandra snapshots on aqs100x servers.	[analytics]
22:58	<btullis>	deleted old snapshots from aqs1006 and aqs1009	[analytics]
17:45	<razzi>	set presto_analytics_hive extra parameter engine_params.connect_args.session_props.query_max_run_time to 55s on superset.wikimedia.org	[analytics]
10:39	<elukey>	roll restart of kafka-test to pick up new truststore (root PKI added)	[analytics]
2021-10-28 §
19:13	<ottomata>	re-enable hdfs-cleaner for /wmf/gobblin	[analytics]
2021-10-26 §
09:01	<btullis>	reverted hive services back to an-coord1001.	[analytics]
2021-10-25 §
16:03	<btullis>	btullis@an-coord1001:~$ sudo systemctl restart hive-server2 hive-metastore	[analytics]
13:02	<btullis>	btullis@an-coord1002:~$ sudo systemctl restart hive-server2 hive-metastore	[analytics]
12:51	<btullis>	btullis@aqs1007:~$ sudo nodetool-a clearsnapshot	[analytics]
2021-10-21 §
14:05	<ottomata>	rerun refine_eventlogging_analytics refine_eventlogging_legacy and refine_event with -ignore-done-flag=true --since=2021-10-21T01:00:00 --until=2021-10-21T04:00:00 for backfill of missing data after gobblin problems	[analytics]
13:39	<btullis>	btullis@an-launcher1002:~$ sudo systemctl restart gobblin-event_default	[analytics]
10:35	<joal>	Re-refine netflow data after gobblin pulled data fix	[analytics]
08:41	<joal>	Rerun webrequest-load jobs for hour 2021-10-21T02:00	[analytics]
2021-10-20 §
18:11	<razzi>	Deployed refinery using scap, then deployed onto hdfs	[analytics]
16:36	<razzi>	deploy refinery change for https://phabricator.wikimedia.org/T287084	[analytics]
07:15	<joal>	rerun webrequest-load-wf-upload-2021-10-20-1 after node issue	[analytics]
06:27	<elukey>	reboot analytics1066 - OS showing CPU soft lockups, tons of defunct processes (including node manager) and high CPU usage	[analytics]
2021-10-19 §
07:14	<joal>	Rerun cassandra-daily-wf-local_group_default_T_mediarequest_top_files-2021-10-17	[analytics]
2021-10-18 §
19:29	<joal>	Rerun cassandra-daily-wf-local_group_default_T_top_pageviews-2021-10-17	[analytics]
18:36	<joal>	Rerun cassandra-daily-wf-local_group_default_T_unique_devices-2021-10-17	[analytics]
16:22	<joal>	rerun cassandra-daily-wf-local_group_default_T_top_percountry-2021-10-17	[analytics]
16:16	<joal>	Rerun cassandra-daily-wf-local_group_default_T_mediarequest_per_referer-2021-10-17	[analytics]
15:17	<joal>	Rerun failed instances from cassandra-hourly-coord-local_group_default_T_pageviews_per_project_v2	[analytics]
14:49	<elukey>	restart hadoop-yarn-nodemanager on an-worker1119 and an-worker1103 (Java OOM in the logs)	[analytics]
12:09	<btullis>	root@aqs1013:/srv/cassandra-b/tmp# systemctl restart cassandra-b.service	[analytics]
12:09	<btullis>	root@aqs1012:/srv/cassandra-b/tmp# systemctl restart cassandra-b.service	[analytics]
09:25	<btullis>	btullis@cumin1001:~$ sudo transfer.py aqs1013.eqiad.wmnet:/srv/cassandra-b/tmp/local_group_default_T_pageviews_per_article_flat an-presto1001.eqiad.wmnet:/srv/cassandra_migration/aqs1013-b/	[analytics]
09:17	<btullis>	btullis@cumin1001:~$ sudo transfer.py aqs1012.eqiad.wmnet:/srv/cassandra-b/tmp/local_group_default_T_pageviews_per_article_flat an-presto1001.eqiad.wmnet:/srv/cassandra_migration/aqs1012-b/	[analytics]
09:16	<btullis>	btullis@cumin1001:~$ sudo transfer.py aqs1012.eqiad.wmnet:/srv/cassandra-b/tmp/local_group_default_T_pageviews_per_article_flat an-presto1001.eqiad.wmnet:/srv/cassandra_migration/cassandra_migration/aqs1012-b/	[analytics]
2021-10-15 §
08:33	<btullis>	btullis@aqs1007:~$ sudo nodetool-b clearsnapshot	[analytics]
2021-10-13 §
19:49	<mforns>	re-ran cassandra-daily-coord-local_group_default_T_pageviews_per_article_flat for 2021-10-12 successfully	[analytics]
17:58	<ottomata>	deleting files on stat1008 in /tmp older than 10 days and larger than 20M sudo find /tmp -mtime +10 -size +20M \| xargs sudo rm -rfv	[analytics]
17:54	<ottomata>	removed /tmp/spark-* files belonging to aikochou on stat1008	[analytics]
2021-10-12 §
15:43	<btullis>	btullis@aqs1008:~$ sudo nodetool-b clearsnapshot	[analytics]
13:17	<btullis>	btullis@analytics1069:~$ sudo shutdown -h now	[analytics]
13:15	<btullis>	btullis@analytics1069:~$ sudo systemctl stop hadoop-hdfs-*	[analytics]
13:14	<btullis>	btullis@analytics1069:~$ sudo systemctl stop hadoop-yarn-nodemanager.service	[analytics]
07:26	<joal>	Rerun cassandra-daily-wf-local_group_default_T_pageviews_per_article_flat-2021-10-11	[analytics]
2021-10-11 §
07:37	<joal>	rerun refine_event for `event`.`mediawiki_content_translation_event` year=2021/month=10/day=10/hour=16	[analytics]
2021-10-10 §
18:07	<joal>	Rerun webrequest-load-wf-text-2021-10-10-10 - failed due to network issue	[analytics]
2021-10-06 §
14:30	<elukey>	upgrade stat1005 to ROCm 4.2.0	[analytics]
13:20	<btullis>	btullis@aqs1004:~$ sudo nodetool-a clearsnapshot	[analytics]
10:20	<elukey>	upgrade ROCm to 4.2 on stat1008	[analytics]