Вялые Записки Скучного Человека

журнал Бориса Овчинникова

Previous Entry Share Next Entry
лучший браузер
barouh

Опытным путем выяснил, какой браузер лучше всего подходит для вытаскивания из веб-интерфейсов (копирования) очень больших табличных массивов данных. "Очень большой" в моем понимании - это 50-100 тысяч строк

Internet Explorer - относительно быстро формирует страницу, но безумно долго ее копирует в буфер обмена (и как правило умирает в процессе)
FireFox - вообще плохо умеет сохранять табличную структуру при копировании и вставке в приложения MS Office
Chrome - быстро начинает отрисовывать страницу (первые пару тысяч строк), но очень долго подгружает остальные десятки тысяч строк. Скопировать такой объем данных в буфер кажется в принципе не способен
Победитель - Opera. Как и Chrome, не выдает страницу целиком, а постепенно выводит ее, кусочками по X строк. Страницу загружает почти так же быстро, как IE, зато копирует в течение нескольких секунд!

Кстати, Opera покорила сердце аналитика еще одним - она не только умеет сохранять веб-страницу в виде текста (Chrome не умеет и этого), но и в отличие от IE разделяет ячейки в таблице пробелами. Правда, если внутри ячейки тоже встречаются пробелы, это не спасает


  • 1
ЕМНИП, опера таки разделяет ячейки таблицы при копировании через буфер не пробелом, но табуляцией.
Что есть весьма и весьма.

А ждать чего-либо более чем "посмотреть страницу" от хрома, я надеюсь, пока рано. Надеюсь, что пока рано. Что все будет.
А оперой до хрома пользовался много годов.

Оперы видимо разные бывают. Моя таки пробелами разделяет

А почему, кстати, нельзя просто сохранить файлик как есть, а потом засосать его вордом каим-нибудь, где и получить таблицу?

во-первых, Ворд тоже плохо ворочает длинные файлы, тем более он мучается с преобразование html-я
во-вторых, когда тебе надо вытащить 5-8 массивов из html и склеить их в один (в Excel или Access), прогонять еще каждый из массивов через промежуточную итерацию в виде Ворда муторно

я конечно на тестирование потратил время - но теперь на будущее знаю, что Опера для подобных нужд рулит

... хотя и у Оперы есть своя нехорошая фигня - она все загоняет себе в память. Весело видеть в диспетчере задач напротив Оперы цифры загрузки памяти порядка 800 мегов. Но не беда - закрыл, открыл и пошел дальше копи-пастить

Re: Ответ на ваш комментарий…

А сразу в ексель засосать? Он, вроде, тоже html умеет.

Re: Ответ на ваш комментарий…

Ну во-первых тестирование браузеров началось с того, что IE еще и html минут 15 сохранял
А во-вторых, у меня эксель старый, там максимум 65 тысяч строк. А через копи-паст я сразу все загнал в таблицу Access

  • 1
?

Log in

No account? Create an account