Смотрите в сторону:
- кол-во чанков в RT индексе. При большом QPS сложно сказать какое оптимальное значение, но оно напрямую может влиять на перф. Сильно много - плохо, т.к. сильно будет распараллеливаться запрос, сильно мало - плохо, т.к. ядра могут быть недозагружены
- Manticore Search Manual: Server settings > Searchd - аналогично
- если памяти достаточно, то mlock для всего https://manual.manticoresearch.com/Creating_an_index/Local_indexes/Plain_and_real-time_index_settings#Accessing-index-files
Sphinx работал тоже на RT индексах или plain? При нагрузке что показывает dstat? Где боттлнек? Процессор или диск? iowait большой?