Ссылка на полный дебаг во время процесса зависания:
https:// disk.yandex.kz/d/aJSkZxmDsCaprw
Searchd.log был по-прежнему без какой-то релевантной информации о зависании. Включил расширенный режим логов debugv уже после зависания, т.к. сильно засоряются, а когда именно случится зависание неизвестно. Время в приложенном файле логов начинается уже после момента зависания.
При попытке остановить процесс searchd --stopwait ничего не происходит, команда просто зависает.
Получилось поймать момент зависания с включенным режимом дебага debugv, зависло примерно в районе 9:10:
https:// disk.yandex.kz/d/HqnAqFZoB4dFpA
С тем, что не дожидаюсь подгрузки binlog кажется вы правы, сейчас больше времени решил подождать после перезапуска. Сначала --status выдавал всё ту же ошибку
FATAL: failed to connect to daemon: please specify listen with sphinx protocol in your config file,
Судя по query log, запросы активно шли до Nov 23 09:16:04.883
И в searchd log’е видно:
[Thu Nov 23 09:16:10.402 2023] [3300328] caught SIGTERM, shutting down
[Thu Nov 23 09:16:13.893 2023] [3300348] DEBUG: got events=1, tick=12450525, interrupted=1
[Thu Nov 23 09:21:31.762 2023] [3362312] watchdog: main process 3362313 forked ok
[Thu Nov 23 09:21:31.776 2023] [3362313] starting daemon version '6.2.12 dc5144d35@230822 (columnar 2.2.4 5aec342@230822) (secondary 2.2.4 5aec342@230822)' ...
[Thu Nov 23 09:21:31.776 2023] [3362313] listening on 127.0.0.1:9312 for sphinx and http(s)
Т.е. в 09:16 вы сделали systemctl stop manticore или типа того, после этого оно зависло и потом уже вы прибили запрос, верно?
Ну вот в этот момент по идее в логе должно быть видно caught SIGTERM, shutting down и это и видно в данном случае. Проблема в том, что после этого должны быть ещё строки и в конце что-то типа:
[Thu Nov 23 10:03:24.893 2023] [1566736] shutdown daemon version '6.2.13 cf6ec3bfd@231121 dev (columnar 2.2.5 975172c@231117) (secondary 2.2.5 975172c@231117) (knn 2.2.5 975172c@231117)' ...
[Thu Nov 23 10:03:24.895 2023] [1566736] shutdown complete