Uma solução de extração e georreferenciamento de anúncios imobiliários da internet

Detalhes bibliográficos
Autor(a) principal: Roberto, Matheus Aparecido da Silva
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/16007
Resumo: O crescimento do território urbano é algo que não se pode controlar, tornando-se uma dificuldade para as organizações municipais. Com a utilização de sistemas de informação geográfica e simulação urbana surge uma nova maneira para tomar decisões no planejamento da cidade. Mas existe uma defasagem grande para isto acontecer de forma natural pelos municípios, isso se deve à falta de bases de dados georreferenciadas para estudo da malha urbana. Como a Internet é um local repleto de informações, se torna uma ótima fonte para extrair o conteúdo desejado. A partir do estudo de vendas de imóveis é possível identificar alterações na cidade pela modificação do preço de venda e expansão do território pelo surgimento de novos imóveis em uma determinada região. Este trabalho propõe criar uma solução que possibilita a extração de informações de sites imobiliários, tais como o endereço e valor de venda e transformar o endereço em coordenadas geográficas, latitude e longitude, disponibilizando uma base de dados para ser utilizada em estudos da cidade. Neste trabalho fez-se uso de sites imobiliários da cidade de Ponta Grossa - Paraná com intuito de extrair informações não estruturadas, endereços e valores de venda, para que este conteúdo pudesse ser transformado em informações aplicáveis à sistemas de simulação urbana e informação geográfica. Para transformar endereço em coordenadas geográficas se tornou necessário utilizar serviço de geolocalização como Google Maps e Open Street Map. Como estas informações não seguem um padrão foi utilizado o formato orientado a documentos para para que se pudesse armazenar os dados encontrados. A aplicação se mostrou eficiente pela quantidade de anúncios extraídos e pela independência do usuário para extrair e georreferenciar a informação.
id UTFPR-12_86bdbf37a5926a3545435a29008f86e0
oai_identifier_str oai:repositorio.utfpr.edu.br:1/16007
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-19T18:25:46Z2020-11-19T18:25:46Z2019-11-20ROBERTO, Matheus Aparecido da Silva. Uma solução de extração e georreferenciamento de anúncios imobiliários da internet. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/16007O crescimento do território urbano é algo que não se pode controlar, tornando-se uma dificuldade para as organizações municipais. Com a utilização de sistemas de informação geográfica e simulação urbana surge uma nova maneira para tomar decisões no planejamento da cidade. Mas existe uma defasagem grande para isto acontecer de forma natural pelos municípios, isso se deve à falta de bases de dados georreferenciadas para estudo da malha urbana. Como a Internet é um local repleto de informações, se torna uma ótima fonte para extrair o conteúdo desejado. A partir do estudo de vendas de imóveis é possível identificar alterações na cidade pela modificação do preço de venda e expansão do território pelo surgimento de novos imóveis em uma determinada região. Este trabalho propõe criar uma solução que possibilita a extração de informações de sites imobiliários, tais como o endereço e valor de venda e transformar o endereço em coordenadas geográficas, latitude e longitude, disponibilizando uma base de dados para ser utilizada em estudos da cidade. Neste trabalho fez-se uso de sites imobiliários da cidade de Ponta Grossa - Paraná com intuito de extrair informações não estruturadas, endereços e valores de venda, para que este conteúdo pudesse ser transformado em informações aplicáveis à sistemas de simulação urbana e informação geográfica. Para transformar endereço em coordenadas geográficas se tornou necessário utilizar serviço de geolocalização como Google Maps e Open Street Map. Como estas informações não seguem um padrão foi utilizado o formato orientado a documentos para para que se pudesse armazenar os dados encontrados. A aplicação se mostrou eficiente pela quantidade de anúncios extraídos e pela independência do usuário para extrair e georreferenciar a informação.The growth of urban territory is something that cannot be controlled, becoming a difficulty for municipal organizations. With the usage of geographic information systems and urban simulation, a new way to make decisions in city planning emerges. Although there is a big gap for it happen naturally by municipalities, this is due to the lack of georeferenced databases for the study of the urban network. As the Internet is a place full of information, it becomes a great source to extract the desired content. From the study of real estate sales, it is possible to identify changes in the city by modifying the sale price and expanding the territory by the emergence of new real estate in a given region. This work proposes to create a solution that enables the extraction of information from real estate sites, such as the address and sale value and turn the address into geographic coordinates, latitude, and longitude, providing a database to be used in studies of the city. In this work it was made use of real estate sites in the city of Ponta Grossa - Paraná to extract unstructured information, addresses, and sales values so that this content could be turned into information applicable to urban simulation systems and geographic information. To transform address into geographic coordinates it became necessary to use geolocation services such as Google Maps and Open Street Map. As this information does not follow a pattern the document-oriented format was chosen so it could store the found data. The application proved to be efficient due to the number of ads extracted and the user's independence to extract and georeferenced the information.porUniversidade Tecnológica Federal do ParanáPonta GrossaCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAnúncios - Mercado imobiliárioAnúncios pela InternetEstruturas de dados (Computação)Advertising - Real estate businessInternet advertisingData structures (Computer science)Uma solução de extração e georreferenciamento de anúncios imobiliários da internetA solution for extracting and georeferencing real estate advertisements from the internetinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPonta GrossaKoscianski, AndréKoscianski, AndréAntunes, Diego RobertoBini, Tarcizio AlexandreRoberto, Matheus Aparecido da Silvainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPG_COCIC_2019_2_11.pdfapplication/pdf1885649http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/1/PG_COCIC_2019_2_11.pdf3d0a018c5d1e0b5034d35c59373ca3fbMD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPG_COCIC_2019_2_11.pdf.txtExtracted texttext/plain98164http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/3/PG_COCIC_2019_2_11.pdf.txt5c7a5eaecfe1aab2f9106919b968021aMD53THUMBNAILPG_COCIC_2019_2_11.pdf.jpgGenerated Thumbnailimage/jpeg1384http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/4/PG_COCIC_2019_2_11.pdf.jpg54c2ba2fd0836e6bd4a1d04bc3bbd422MD541/160072020-11-19 16:25:47.233oai:repositorio.utfpr.edu.br:1/16007TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-19T18:25:47Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
dc.title.alternative.pt_BR.fl_str_mv A solution for extracting and georeferencing real estate advertisements from the internet
title Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
spellingShingle Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
Roberto, Matheus Aparecido da Silva
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Anúncios - Mercado imobiliário
Anúncios pela Internet
Estruturas de dados (Computação)
Advertising - Real estate business
Internet advertising
Data structures (Computer science)
title_short Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
title_full Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
title_fullStr Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
title_full_unstemmed Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
title_sort Uma solução de extração e georreferenciamento de anúncios imobiliários da internet
author Roberto, Matheus Aparecido da Silva
author_facet Roberto, Matheus Aparecido da Silva
author_role author
dc.contributor.advisor1.fl_str_mv Koscianski, André
dc.contributor.referee1.fl_str_mv Koscianski, André
dc.contributor.referee2.fl_str_mv Antunes, Diego Roberto
dc.contributor.referee3.fl_str_mv Bini, Tarcizio Alexandre
dc.contributor.author.fl_str_mv Roberto, Matheus Aparecido da Silva
contributor_str_mv Koscianski, André
Koscianski, André
Antunes, Diego Roberto
Bini, Tarcizio Alexandre
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Anúncios - Mercado imobiliário
Anúncios pela Internet
Estruturas de dados (Computação)
Advertising - Real estate business
Internet advertising
Data structures (Computer science)
dc.subject.por.fl_str_mv Anúncios - Mercado imobiliário
Anúncios pela Internet
Estruturas de dados (Computação)
Advertising - Real estate business
Internet advertising
Data structures (Computer science)
description O crescimento do território urbano é algo que não se pode controlar, tornando-se uma dificuldade para as organizações municipais. Com a utilização de sistemas de informação geográfica e simulação urbana surge uma nova maneira para tomar decisões no planejamento da cidade. Mas existe uma defasagem grande para isto acontecer de forma natural pelos municípios, isso se deve à falta de bases de dados georreferenciadas para estudo da malha urbana. Como a Internet é um local repleto de informações, se torna uma ótima fonte para extrair o conteúdo desejado. A partir do estudo de vendas de imóveis é possível identificar alterações na cidade pela modificação do preço de venda e expansão do território pelo surgimento de novos imóveis em uma determinada região. Este trabalho propõe criar uma solução que possibilita a extração de informações de sites imobiliários, tais como o endereço e valor de venda e transformar o endereço em coordenadas geográficas, latitude e longitude, disponibilizando uma base de dados para ser utilizada em estudos da cidade. Neste trabalho fez-se uso de sites imobiliários da cidade de Ponta Grossa - Paraná com intuito de extrair informações não estruturadas, endereços e valores de venda, para que este conteúdo pudesse ser transformado em informações aplicáveis à sistemas de simulação urbana e informação geográfica. Para transformar endereço em coordenadas geográficas se tornou necessário utilizar serviço de geolocalização como Google Maps e Open Street Map. Como estas informações não seguem um padrão foi utilizado o formato orientado a documentos para para que se pudesse armazenar os dados encontrados. A aplicação se mostrou eficiente pela quantidade de anúncios extraídos e pela independência do usuário para extrair e georreferenciar a informação.
publishDate 2019
dc.date.issued.fl_str_mv 2019-11-20
dc.date.accessioned.fl_str_mv 2020-11-19T18:25:46Z
dc.date.available.fl_str_mv 2020-11-19T18:25:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ROBERTO, Matheus Aparecido da Silva. Uma solução de extração e georreferenciamento de anúncios imobiliários da internet. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/16007
identifier_str_mv ROBERTO, Matheus Aparecido da Silva. Uma solução de extração e georreferenciamento de anúncios imobiliários da internet. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/16007
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Informática
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/1/PG_COCIC_2019_2_11.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/3/PG_COCIC_2019_2_11.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/16007/4/PG_COCIC_2019_2_11.pdf.jpg
bitstream.checksum.fl_str_mv 3d0a018c5d1e0b5034d35c59373ca3fb
b9d82215ab23456fa2d8b49c5df1b95b
5c7a5eaecfe1aab2f9106919b968021a
54c2ba2fd0836e6bd4a1d04bc3bbd422
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923251927384064