Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/16007 |
Resumo: | O crescimento do território urbano é algo que não se pode controlar, tornando-se uma dificuldade para as organizações municipais. Com a utilização de sistemas de informação geográfica e simulação urbana surge uma nova maneira para tomar decisões no planejamento da cidade. Mas existe uma defasagem grande para isto acontecer de forma natural pelos municípios, isso se deve à falta de bases de dados georreferenciadas para estudo da malha urbana. Como a Internet é um local repleto de informações, se torna uma ótima fonte para extrair o conteúdo desejado. A partir do estudo de vendas de imóveis é possível identificar alterações na cidade pela modificação do preço de venda e expansão do território pelo surgimento de novos imóveis em uma determinada região. Este trabalho propõe criar uma solução que possibilita a extração de informações de sites imobiliários, tais como o endereço e valor de venda e transformar o endereço em coordenadas geográficas, latitude e longitude, disponibilizando uma base de dados para ser utilizada em estudos da cidade. Neste trabalho fez-se uso de sites imobiliários da cidade de Ponta Grossa - Paraná com intuito de extrair informações não estruturadas, endereços e valores de venda, para que este conteúdo pudesse ser transformado em informações aplicáveis à sistemas de simulação urbana e informação geográfica. Para transformar endereço em coordenadas geográficas se tornou necessário utilizar serviço de geolocalização como Google Maps e Open Street Map. Como estas informações não seguem um padrão foi utilizado o formato orientado a documentos para para que se pudesse armazenar os dados encontrados. A aplicação se mostrou eficiente pela quantidade de anúncios extraídos e pela independência do usuário para extrair e georreferenciar a informação. |
id |
UTFPR-12_86bdbf37a5926a3545435a29008f86e0 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/16007 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-19T18:25:46Z2020-11-19T18:25:46Z2019-11-20ROBERTO, Matheus Aparecido da Silva. Uma solução de extração e georreferenciamento de anúncios imobiliários da internet. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/16007O crescimento do território urbano é algo que não se pode controlar, tornando-se uma dificuldade para as organizações municipais. Com a utilização de sistemas de informação geográfica e simulação urbana surge uma nova maneira para tomar decisões no planejamento da cidade. Mas existe uma defasagem grande para isto acontecer de forma natural pelos municípios, isso se deve à falta de bases de dados georreferenciadas para estudo da malha urbana. Como a Internet é um local repleto de informações, se torna uma ótima fonte para extrair o conteúdo desejado. A partir do estudo de vendas de imóveis é possível identificar alterações na cidade pela modificação do preço de venda e expansão do território pelo surgimento de novos imóveis em uma determinada região. Este trabalho propõe criar uma solução que possibilita a extração de informações de sites imobiliários, tais como o endereço e valor de venda e transformar o endereço em coordenadas geográficas, latitude e longitude, disponibilizando uma base de dados para ser utilizada em estudos da cidade. Neste trabalho fez-se uso de sites imobiliários da cidade de Ponta Grossa - Paraná com intuito de extrair informações não estruturadas, endereços e valores de venda, para que este conteúdo pudesse ser transformado em informações aplicáveis à sistemas de simulação urbana e informação geográfica. Para transformar endereço em coordenadas geográficas se tornou necessário utilizar serviço de geolocalização como Google Maps e Open Street Map. Como estas informações não seguem um padrão foi utilizado o formato orientado a documentos para para que se pudesse armazenar os dados encontrados. A aplicação se mostrou eficiente pela quantidade de anúncios extraídos e pela independência do usuário para extrair e georreferenciar a informação.The growth of urban territory is something that cannot be controlled, becoming a difficulty for municipal organizations. With the usage of geographic information systems and urban simulation, a new way to make decisions in city planning emerges. Although there is a big gap for it happen naturally by municipalities, this is due to the lack of georeferenced databases for the study of the urban network. As the Internet is a place full of information, it becomes a great source to extract the desired content. From the study of real estate sales, it is possible to identify changes in the city by modifying the sale price and expanding the territory by the emergence of new real estate in a given region. This work proposes to create a solution that enables the extraction of information from real estate sites, such as the address and sale value and turn the address into geographic coordinates, latitude, and longitude, providing a database to be used in studies of the city. In this work it was made use of real estate sites in the city of Ponta Grossa - Paraná to extract unstructured information, addresses, and sales values so that this content could be turned into information applicable to urban simulation systems and geographic information. To transform address into geographic coordinates it became necessary to use geolocation services such as Google Maps and Open Street Map. As this information does not follow a pattern the document-oriented format was chosen so it could store the found data. The application proved to be efficient due to the number of ads extracted and the user's independence to extract and georeferenced the information.porUniversidade Tecnológica Federal do ParanáPonta GrossaCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnúncios - Mercado imobiliárioAnúncios pela InternetEstruturas de dados (Computação)Advertising - Real estate businessInternet advertisingData structures (Computer science)Uma solução de extração e georreferenciamento de anúncios imobiliários da internetA solution for extracting and georeferencing real estate advertisements from the internetinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPonta GrossaKoscianski, AndréKoscianski, AndréAntunes, Diego RobertoBini, Tarcizio AlexandreRoberto, Matheus Aparecido da Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPG_COCIC_2019_2_11.pdfapplication/pdf1885649http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/1/PG_COCIC_2019_2_11.pdf3d0a018c5d1e0b5034d35c59373ca3fbMD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPG_COCIC_2019_2_11.pdf.txtExtracted texttext/plain98164http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/3/PG_COCIC_2019_2_11.pdf.txt5c7a5eaecfe1aab2f9106919b968021aMD53THUMBNAILPG_COCIC_2019_2_11.pdf.jpgGenerated Thumbnailimage/jpeg1384http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/4/PG_COCIC_2019_2_11.pdf.jpg54c2ba2fd0836e6bd4a1d04bc3bbd422MD541/160072020-11-19 16:25:47.233oai:repositorio.utfpr.edu.br:1/16007TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-19T18:25:47Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
dc.title.alternative.pt_BR.fl_str_mv |
A solution for extracting and georeferencing real estate advertisements from the internet |
title |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
spellingShingle |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet Roberto, Matheus Aparecido da Silva CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Anúncios - Mercado imobiliário Anúncios pela Internet Estruturas de dados (Computação) Advertising - Real estate business Internet advertising Data structures (Computer science) |
title_short |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
title_full |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
title_fullStr |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
title_full_unstemmed |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
title_sort |
Uma solução de extração e georreferenciamento de anúncios imobiliários da internet |
author |
Roberto, Matheus Aparecido da Silva |
author_facet |
Roberto, Matheus Aparecido da Silva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Koscianski, André |
dc.contributor.referee1.fl_str_mv |
Koscianski, André |
dc.contributor.referee2.fl_str_mv |
Antunes, Diego Roberto |
dc.contributor.referee3.fl_str_mv |
Bini, Tarcizio Alexandre |
dc.contributor.author.fl_str_mv |
Roberto, Matheus Aparecido da Silva |
contributor_str_mv |
Koscianski, André Koscianski, André Antunes, Diego Roberto Bini, Tarcizio Alexandre |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Anúncios - Mercado imobiliário Anúncios pela Internet Estruturas de dados (Computação) Advertising - Real estate business Internet advertising Data structures (Computer science) |
dc.subject.por.fl_str_mv |
Anúncios - Mercado imobiliário Anúncios pela Internet Estruturas de dados (Computação) Advertising - Real estate business Internet advertising Data structures (Computer science) |
description |
O crescimento do território urbano é algo que não se pode controlar, tornando-se uma dificuldade para as organizações municipais. Com a utilização de sistemas de informação geográfica e simulação urbana surge uma nova maneira para tomar decisões no planejamento da cidade. Mas existe uma defasagem grande para isto acontecer de forma natural pelos municípios, isso se deve à falta de bases de dados georreferenciadas para estudo da malha urbana. Como a Internet é um local repleto de informações, se torna uma ótima fonte para extrair o conteúdo desejado. A partir do estudo de vendas de imóveis é possível identificar alterações na cidade pela modificação do preço de venda e expansão do território pelo surgimento de novos imóveis em uma determinada região. Este trabalho propõe criar uma solução que possibilita a extração de informações de sites imobiliários, tais como o endereço e valor de venda e transformar o endereço em coordenadas geográficas, latitude e longitude, disponibilizando uma base de dados para ser utilizada em estudos da cidade. Neste trabalho fez-se uso de sites imobiliários da cidade de Ponta Grossa - Paraná com intuito de extrair informações não estruturadas, endereços e valores de venda, para que este conteúdo pudesse ser transformado em informações aplicáveis à sistemas de simulação urbana e informação geográfica. Para transformar endereço em coordenadas geográficas se tornou necessário utilizar serviço de geolocalização como Google Maps e Open Street Map. Como estas informações não seguem um padrão foi utilizado o formato orientado a documentos para para que se pudesse armazenar os dados encontrados. A aplicação se mostrou eficiente pela quantidade de anúncios extraídos e pela independência do usuário para extrair e georreferenciar a informação. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-20 |
dc.date.accessioned.fl_str_mv |
2020-11-19T18:25:46Z |
dc.date.available.fl_str_mv |
2020-11-19T18:25:46Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ROBERTO, Matheus Aparecido da Silva. Uma solução de extração e georreferenciamento de anúncios imobiliários da internet. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/16007 |
identifier_str_mv |
ROBERTO, Matheus Aparecido da Silva. Uma solução de extração e georreferenciamento de anúncios imobiliários da internet. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/16007 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Informática |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Ponta Grossa |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/1/PG_COCIC_2019_2_11.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/3/PG_COCIC_2019_2_11.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/4/PG_COCIC_2019_2_11.pdf.jpg |
bitstream.checksum.fl_str_mv |
3d0a018c5d1e0b5034d35c59373ca3fb b9d82215ab23456fa2d8b49c5df1b95b 5c7a5eaecfe1aab2f9106919b968021a 54c2ba2fd0836e6bd4a1d04bc3bbd422 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923251927384064 |