Optimized version of task-2 #123

bshourse · 2025-02-13T14:34:56Z

Поревьюйте пожалуйста.

Описание в case-study.md

spajic

✅

spajic · 2025-02-17T18:13:06Z

case-study.md

+Time taken: 7.52 seconds
+Memory usage: 17 MB
+
+В бюджет уложился. Время обработки снизилось в ~3.26 раз от значений полученых после оптимизации в задании 1.


spajic · 2025-02-17T18:15:15Z

case-study.md

+
+Вот тут начались трудности, я пытался не делать это через сплит, парсил посимвольно, даже написал что-то.
+Сначала я добавил построчное чтение с foreach, результат особо не изменился видимо потому что файл слишком маленького размера и проблема скорее не в загрузки фала в память а в агригировании данных в памяти создания дополнительных объектов. Тут я пока не понял как они по какой формуле можно посчитать заранее какое количество объектов того или иного класса будет на большем объеме данных(нужно заново смотреть ваши ведео)
+Потратил очень много времени, минус моральнулся потому, что от сплита избаивался кое как, а осталось понимание что есть куча мест с агригированием данных которые делаются в памяти(я это помнил но уделил внимание на точку росту которая показывалась memory profile-ром.


да, тут разные вещи смешались и вас запутали

количество аллокаций

максимальный объём RSS

может быть сколько угодно много аллокаций, но если это временные объекты и GC может их удалять, то MAX RSS расти не будет

в этом задании нет смысла особо напирать на снижение кол-ва аллокаций, главное не накапливать данные в памяти

но потренироваться находить и убирать лишние аллокации тоже полезно; если объект не создавать, то и не придётся его потом удалять - profit

spajic · 2025-02-17T18:16:21Z

profiling/profiling_helpers.rb

+
+def profile
+  profile_memory do
+    profile_time do


не надо смешивать много всего сразу

профилирование памяти отдельно - замеры времени отедльно - замеры памяти отдельно

наличие профилировщика тормозит работу и раздуавает память, поэтому мерить надо всё без профилировщика

spajic · 2025-02-17T18:17:33Z

spec/services/report_processor_performance_spec.rb

+  describe '#performance check' do
+    context 'when file contains 3_250_940 lines' do
+      it 'performs under 10 seconds' do
+        expect { service.call(input_file_name: 'data_large.txt') }.to perform_under(10).sec


👍 хорошо, но это не совсем тема данного задания

Refactor report processing

9148880

spajic approved these changes Feb 17, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Optimized version of task-2 #123

Optimized version of task-2 #123

bshourse commented Feb 13, 2025

spajic left a comment

spajic Feb 17, 2025

spajic Feb 17, 2025

spajic Feb 17, 2025

spajic Feb 17, 2025

Optimized version of task-2 #123

Are you sure you want to change the base?

Optimized version of task-2 #123

Conversation

bshourse commented Feb 13, 2025

spajic left a comment

Choose a reason for hiding this comment

spajic Feb 17, 2025

Choose a reason for hiding this comment

spajic Feb 17, 2025

Choose a reason for hiding this comment

spajic Feb 17, 2025

Choose a reason for hiding this comment

spajic Feb 17, 2025

Choose a reason for hiding this comment