Вернуться   Форум программистов > Программирование > Java

Java Программирование на Java

Ответ
 
Опции темы Опции просмотра
Старый 11.05.2009, 18:24   #1
Lila
Новичок
 
Регистрация: 11.05.2009
Сообщений: 1
Lila пока не определено
По умолчанию парсинг html

Здравствуйте!

Мне очень нужна ваша помощь:

Я разбираюсь с парсингом html. Все относительно понятно. Но во всех примерах берется html-файл, который находится в той директории, из которой выполняется программа.

А мне надо работать не со скачанной страницей, а с html-файлом в Интернете. Для этого нужно что-то специально подключать?

Подскажите, где можно про это почитать.



И вцелом, с помощью чего лучше парсить html?



Заранее всем благодарна!
Lila вне форума   Ответить с цитированием
Старый 09.11.2009, 07:05   #2
simplepilot
Местный
 
Регистрация: 15.05.2001
Сообщений: 368
simplepilot пока не определено
По умолчанию RE: парсинг html

public class URL_Reader

{

private static int BUFFER_SIZE=164;



/************************************************** ************************************************** ***************

* Load HTML page from the provided source. Very slow :-(

************************************************** ************************************************** ***************/

protected final StringBuffer read(final String url)

throws Exception

{

final URLConnection url_con = new URL(url).openConnection();



final InputStreamReader reader = new InputStreamReader(url_con.getInputStream());

final StringBuffer buffer_s = new StringBuffer(BUFFER_SIZE);



int length=0;





while (true)

{

int i = reader.read();

if (i==-1) break;

char x = (char)i;

buffer_s.append(x);

length++;

}

reader.close();



return buffer_s;

}

}
simplepilot вне форума   Ответить с цитированием
Ответ

Опции темы
Опции просмотра

Похожие темы
Тема Автор
Java, OC4J 10.1.3.3.3 и jsf 1.2 - вместе не работают?
Здравствуйте! Есть EJB приложение, работающее под OC4j 10.1.3.3.3. В пользовательском интерфейсе есть custom-компоненты, написанные под myfaces для jsf 1.1. Писала не я, а другой программист. Моя задача - переписать компоненты под jsf 1.2. Скачала myfaces для jsf1.2. Завернула приложение в EAR архив, при деплое веб-модуля OC4j ругается: 09/05/04 15:52:12 WARNING: DeployerRunnable.run java.lang.NoSuchMethodError:.... OC4J 10.1.3.3.3 и jsf 1.2 - вместе не работают?
anna_malova
Java, Стартовые параметры для MS JVM
Имею насущную потребность стартовать Microsoft VM, прописывая параметры Xmx и Xms. Куда бы ей это можно было сделать?. Стартовые параметры для MS JVM
Tinki87
Java, У Меня Несколько Вопросов
Zdrastvuity, Ja deveti klasnik i tolko ne davno nachal zanimatsy Javoy. Vot za moe neskolko mesatsov skopilas mnogo voprosov. Esli vi mogite mne pomoch eto bilo bi ochen zdorov, cpasibo v budoshee. 1) Eto malinki class ja zdelal chtobi na frame okazalas kortinka "fridge.jpg" File tam esti no on ne vesphechivaetsa na frame. Ja ne znau kak ispolzavat buffered image a ImageIcon nelza v stavit v frame. Hochu eto ja potamushto dly projecta mne budit nugno shtobi imet foto na foto, ili,.... У Меня Несколько Вопросов
dspoka
Java, формирование HtmlDataTable
Есть такой код: private HtmlDataTable myTable = new HtmlDataTable(); public HtmlDataTable getMyTable() {. формирование HtmlDataTable
Stjusha
Java, удаление нескольких строк из таблицы в JSF NetBeans.
Здравствуйте всем! Подскажите, please. Как правильно реализовать удаление срок из таблицы Table в JSF. У меня есть чекбоксы на против каждой строки. Мне надо передать id -ники, которые скрыты в чекбоксах в процедуру для удаления. Я пыталась, передавать их с помощью hiddenfield, но он берет только последную сроку. У меня получается удалить все строки сразу, а выборочные не получается.. удаление нескольких строк из таблицы в JSF NetBeans.
aranazh
Java, Hotkey Eclipse в Linux
Собственно стоит Eclipse 3.4.1, система Debian 4.0, KDE 4. Проблема в том что большинство горячих клавиш не сробатывает (например ctrl+F6), на ноуте под Убунтой 8.10 с гномом стоит тот же пакет Eclipse и все работает. Кто сталкивался помогите в чем проблема, и как лечится.. Hotkey Eclipse в Linux
kirkh
Java, Как получить информацию о компьютере?
Господа, подскажите, пожалуйста, как в программу на Ява включить такую возможность, как получение информации о компьютере (операционная система, загруженность оперативной памяти, имя компьютера и т.д), находящимся в корпаративной сети в интернете?????. Как получить информацию о компьютере?
DABeS
Java, Applet + NTLM
Есть технология прозрачной аутенфикации, завязанная на Микрософтовском протоколе НТЛМ. Замечательно реализуется сервлетами и иже с ними, поскольку процесс получения пароля заключается в общении "сервлет-браузер клиента". Однако, есть насущная потребность сделать то же самое через апплет. Я могу установить connection на сервлет с механизмом авторизации и даже получить от него response на генерацию соответствующих заголовков. Но фишка в том, что response ловит апплет - тупо лыбится и не знает,.... Applet + NTLM
Tinki87

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Выкл.
HTML код Выкл.

Быстрый переход


Текущее время: 07:44. Часовой пояс GMT +4.


Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2010, Jelsoft Enterprises Ltd. Перевод: zCarot

Рейтинг@Mail.ru