Thứ Ba, 29 tháng 12, 2015

ELK Stack

What is the ELK Stack?

The ELK stack consists of Elasticsearch, Logstash, and Kibana. Although they've all been built to work exceptionally well together, each one is a separate project that is driven by the open-source vendor Elastic—which itself began as an enterprise search platform vendor. It has now become a full-service analytics software company, mainly because of the success of the ELK stack. Wide adoption of Elasticsearch for analytics has been the main driver of its popularity.

Data constantly flows into your systems, but it can quickly grow to be fat and stale. As your data set grows larger, your analytics will slow up, resulting in sluggish insights. And this is likely to be a serious business problem. So, the BIG question for your big data is: how can you maintain valuable business insights?

Not long ago, an epiphany ran through the industry: analytics is, in essence, a search problem that needs coupling with good visualizations. So, there was a marriage: Lucene with all its search goodness was brought together with the distributed-computing goodness that is Elasticsearch. Logstash came onto the scene to normalize all kinds of time-series data. Pop in Kibana's ultra-simple visualization tool, and you have a complete analytics tool that can rival very expensive and scalable solutions from Oracle, Palantir, Tableau, Splunk, Microsoft, and others. You, too, can play with the big boys for a lot less $$.

Let's ask the question a bit differently. How can you maintain blazing-fast analytics as you data grows larger and larger? Answer: the ELK stack makes it way easier -- and way faster -- to search and analyze large data sets.

We should mention that ELK is quite versatile. Use the stack as a stand-alone application, or integrate with your existing applications to get the most current data. With Elasticsearch, you get all the features to make real-time decisions-all the time. You can use each of these tools separately, or with other products. For example, Kibana often goes together with Solr/Lucene. Although none of these is a project of the Apache Foundation, each part of the stack falls under the Apache 2 License. Elasticsearch owns both the intellectual property and the trademarks.

Elasticsearch — The Amazing Log Search Tool

Elasticsearch is a juggernaut solution for your data extraction problems. A single developer can use it to find the high-value needles underneath all of your data haystacks, so you can put your team of data scientists to work on another project. Consider these benefits:
  • Real-time data and real-time analytics. The ELK stack gives you the power of real-time data insights, with the ability to perform super-fast data extractions from virtually all structured or unstructured data sources. Real-time extraction, and real-time analytics. Elasticsearch is the engine that gives you both the power and the speed.
  • Scalable, high-availability, multi-tenant. With Elasticsearch, you can start small and expand it along with your business growth-when you are ready. It is built to scale horizontally out of the box. As you need more capacity, simply add another node and let the cluster reorganize itself to accommodate and exploit the extra hardware. Elasticsearch clusters are resilient, since they automatically detect and remove node failures. You can set up multiple indices and query each of them independently or in combination.
  • Full text search. Under the cover, Elasticsearch uses Lucene to provide the most powerful full-text search capabilities available in any open-source product. The search features come with multi-language support, an extensive query language, geolocation support, and context-sensitive suggestions, and autocompletion.
  • Document orientation. You can store complex, real-world entities in Elasticsearch as structured JSON documents. All fields have a default index, and you can use all the indices in a single query to get precise results in the blink of an eye.

Logstash — Routing Your Log Data

Logstash is a tool for log data intake, processing, and output. This includes virtually any type of log that you manage: system logs, webserver logs, error logs, and app logs. As administrators, we know how much time can be spent normalizing data from disparate data sources. We know, for example, how widely Apache logs differ from NGINX logs.

Rather than normalizing with time-sucking ETL (Extract, Transform, and Load), we recommend that you switch over to the fast track. Instead, you could spend much less time training Logstash to normalize the data, getting Elasticsearch to process the data, and then visualize it with Kibana. With Logstash, it's super easy to take all those logs and store them in a central location. The only prerequisite is a Java runtime, and it takes just two commands to get Logstash up and running.

Using Elasticsearch as a backend datastore and Kibana as a frontend dashboard (see below), Logstash will serve as the workhorse for storage, querying and analysis of your logs. Since it has an arsenal of ready-made inputs, filters, codecs, and outputs, you can grab hold of a very powerful feature-set with a very little effort on your part.

Think of Logstash as a pipeline for event processing: it takes precious little time to choose the inputs, configure the filters, and extract the relevant, high-valuedata from your logs. Take a few more steps, make it available to Elasticsearch and—BAM!—you get super-fast queries against your mountains of data.

Kibana — Visualizing Your Log Data

Kibana is your log-data dashboard. Get a better grip on your large data stores with point-and-click pie charts, bar graphs, trendlines, maps and scatter plots. You can visualize trends and patterns for data that would otherwise be extremely tedious to read and interpret. Eventually, each business line can make practical use of your data collection as you help them customize their dashboards. Save it, share it, and link your data visualizations for quick and smart communication.

How Can I Use the ELK Stack to Manage my Log Data?

Your critical business questions have answers in logs of your applications and systems, but most potential users of the data in those logs assume that the accessibility barrier is too high. But the answers are in there -- answers to questions such as:
  • How many account signups this week?
  • What is the effectiveness of our ad campaign?
  • What is the best time to perform system maintenance?
  • Why is my database performance slow?
(Qbox)

Three way to use Logstash with Hadoop Hdfs



Logstash is a great tool for managing events and logs. You can use it to collect logs, parse them, and store them for later use (like, for searching). It is fully free and fully open source. The license is Apache 2.0, meaning you are pretty much free to use it however you want in whatever way.

But for now, Logstash doesn't support output log to Hadoop Hdfs, it's a really big missing fearture, so you if you are Logstash's fan, you have 3 way to put your log to Hadoop Hdfs from Logstash

(Tú Phập)

Thứ Tư, 19 tháng 8, 2015

Anh trai

Một con đường nhỏ, một lối vào cũng nhỏ, một hàng lưng dậu thẳng đều,và tuổi thơ dè dặt bên những khoảng trời rất nhỏ. Tôi đã khép mình để cố nhét hết những kỉ niệm đó vào trong những suy tưởng mông lung và xa xôi. Tháng 6 nắng quê tôi chói chang lắm, nắng phơi những vạt cỏ bạc phếch màu, nắng quắt quay trên những mỏm núi đá vôi trắng xóa, trên những đỉnh đèo mà anh tôi thường đi qua. Tôi chờ anh vác củi về, rồi chạy lẽo đẽo theo sau. Tôi nấp mình sau cái bóng to lớn, nghiêng nghiêng vì phải vác trên vai một khúc gỗ rất to, chờ anh gọi tên tôi(*) rồi nhoẻn cười, tôi cũng cười, anh xoa xoa hai bàn tay chai sần rồi chụp lấy cái đầu của tôi, kéo tôi vào trong khoảng sân im mát.
Anh là hiệp sĩ của riêng tôi trong những trận đòn của bố bởi những rắc rối mà tôi tự gây ra. Anh là hiệp sĩ của riêng tôi trước những cái tát của cuộc đời và những đớn đau mà tâm hồn tôi mang lại. Tôi vẫn khép mình để giữ cho riêng mình một người hùng như thế

(*) Anh vẫn thường gọi tôi là Hưng Lùn :D

Hà Nội, lòng xác xơ 190815

Q

Đêm có hờn dỗi anh không
Mà cô đơn đến mênh mông cõi lòng...

Nghe: Chỉ còn lại tình yêu (Sỹ Hưng)

Hà nội, ngày tháng năm

Thứ Ba, 18 tháng 8, 2015

Hán, Hơp, Huy, Hưng, Hoàng, Vũ Lùn

Ta có là gì của nhau
Mà sao cứ nói lau chau suốt ngày
(Thơ vô nghĩa bỏ mẹ)
Nghe: Dòng thời gian (Sỹ Hưng)

Hà Nội, ngây ngây

Trà Chanh

Kỉ niệm một lần uống trà chanh bị tào tháo đuổi ;))

Qua ngã tư sở trà chanh
Cũng thử một cốc uống nhanh rồi về
Uống xong thì chẳng thấy mê
Cái lề ngon ngọt với mùi "săn lai"
Xung quanh già trẻ gái trai
Áo quần xanh đỏ tóc tai màu vàng
Cô em ăn nói nhẹ nhàng
Tay bê ly nước một tràng vui tươi
Bỗng dưng tôi thấy trong người
Sôi lên sùng sục như kim gặp kiều
Thì ra cái bụng mĩ miều
Đang sôi sùng sục như kiêu gặp kìm =)) :D
Tôi đưa hai mắt lim dim
Toát mồ hôi trán đi tìm cái xe
Mấy cu bảo vệ le te
"Anh cứ để ém dắt xe cho lào"
Tôi lên xe phóng ào ào
Về nhanh, mở cửa, chui vào kép xê
Đến lúc này vẫn thấy phê
Bác tào hành hạ em là liệt luôn
Nghĩ đi nghĩ lại vẫn buồn...
Bực lên bố chửi cái luồn trà chanh!!!

Hà Nội, có một nỗi buồn không giống nỗi buồn nào ...

(240414 Những kỉ niệm...)

Cuối tháng tư mà trời vẫn còn những cơn mưa phùn như đầu xuân,khiến mọi thứ ẩm ướt đến khó chịu. Một mình trong căn phòng trọ, hắn uể oải đặt lưng xuống giường, hai mắt lim dim nhìn cái quạt trần đang quay. Chả muốn làm gì trong cái tâm trạng chán ngắt này, hắn buông một tiếng thở dài. Bình thường giờ này có thể hắn đang ngồi uống trà đá với thằng bạn thân, nhưng mấy hôm nay thằng D ốm nằm liệt giường ở nhà không đi đâu được. Hắn và thằng D có một thói quen, mà theo quan điểm của một người sống phi khoa học như hắn thì đó thực sự là một cách sống phản khoa học - Uống trà đá vào lúc 11h đêm. Nhưng dù sao hôm nay hắn cũng không có hứng thú gì, người yêu hắn vừa nói lời chia tay chiều nay. Hắn cũng chằng biết phải nói gì với cô ấy nữa, những lí do cô ấy đưa ra theo kiểu lý thuyết tình yêu trên kênh14 thì quá đúng, tóm lại là đều do lỗi của hắn, thôi thì đành im lặng...
Và lúc này đây hắn cũng đang chìm trong im lặng, cái im lặng tĩnh mịch hiếm có ở xóm trọ đông đúc này...
"Đêm đã về khuya, xin quý vị và các bạn hãy vặn nhỏ máy thu thanh để không làm phiền người khác và tiếp tục lắng nghe chương trình đọc truyện đêm khuya..."

Dường như hắn nghe thấy tiếng radio, cái âm thanh khe khẽ trầm trầm và quá đỗi thân thuộc với hắn vào mối tối, trước khi hắn kê lọt hẳn vào vòng tay của bố và chìm đắm trong những giấc mơ...

"Ê mi ơi, mi mần răng bày cho tau đá được quả bóng đi mạnh như mi cấy" thằng D nhìn hắn với ánh mắt cầu thị, khỏi phải nói hắn hãnh diện như thế nào, và lẽ dĩ nhiên thằng D sẽ nhận được sự giúp đỡ tận tình hết sức của một huấn luyện viên chuyên nghiệp như hắn. Nhưng thằng D quả là một thằng không có một chút năng khiếu nào về bóng đá hết, và thằng này không thể khá lên được, hắn đưa ra kết luận sau một buổi chiều mệt nhoài với trò tập sút cầu môn. Nhưng dù sao thằng D cũng biết bắt gôn và quan trọng nhất nó có quả bóng xịn mà mẹ nó mua ở đâu tận Thủ Đô, bóng xịn lắm ý, nên nó đủ điều kiện để chơi cùng đội của hắn :D. Cạnh nhà và cũng trong team của hắn còn có thằng H, ngoài cái tính láu cá của H thì nói chung thằng này cũng ổn, hắn và H đích thị là một cặp tiền đạo song sát vô tiền khoáng hậu ở cái Thị Trấn bé nhỏ này. Thằng H chơi bóng khá thông minh và láu cá giống như tính cách của nó, và quan trọng là hắn và H quá hiểu nhau. Hai đứa thường có những pha phối hợp, ghi những bàn thắng đẹp để đời giống như trên tivi. Trên cái sân bóng hiện đại và lớn nhất của Thị Trấn, mỗi buổi chiều luôn được chia ra thành các sân nhỏ, thanh niên, trẻ con, ông già đều tụ tập về đây, mỗi nhóm dành lấy một sân, chia đội và đá. Nhóm nào đến trước thì dành được sân đẹp, nhóm nào đến sau thì phải đá ở phần sân xấu hơn, nhưng nói vậy chứ cái gì nó cũng có ngoại lệ, đám thanh niên lớn nhất luôn dành được sân đẹp nhất, bất kể là đến sớm hay muộn. Những trận đấu diễn ra thường có khá nhiều khán giả là các em nhỏ và các cụ già, đôi khi là mấy thằng đến muộn, không có sân để đá thì cũng đành phải làm khán giả. Và hắn cho rằng chỉ có hai trận đấu là đáng để xem, đó là trận của đám thanh niên lớn và một trận diễn ra ở mảnh sân có đám cỏ tốt lút bên rìa của sân vận động chính là trận có 2 ngôi sao là hắn và thằng H. Đôi khi, đám thanh niên lớn cũng ngó qua xem trận đấu của đội hắn và khen nức nở. Hắn và thằng H được đám thanh niên đặt biệt danh, hắn thì là Ê Rích Can Tô Na, còn thằng H thì là Pôn Sở Cô. Pôn Sờ Cô đá rất hay, phải nói là cầu thủ có kĩ thuật cực kì toàn diện, nhưng dù sao Ê Rích vẫn là vua. Hắn hãnh diện vì điều này và luôn cố gắng chơi bóng thật hay để không phụ lòng người hâm mộ, tuy nhiên thỉnh thoảng hắn thấy thằng H chơi hay hơn ở một số trận, nhưng điều đó đâu có quan trọng, quan trọng là hắn và H vẫn chơi hợp ý nhau, và đội bóng luôn dành được chiến thắng.
Còn thằng D, chắc nó chỉ chơi được ở vị trí thủ môn...

Tháng sáu, đồng nghĩa với tất cả những điều tuyệt vời nhất thế giới, là bắt đầu một mùa hè dữ dội của hắn và đám trẻ con trong xóm...

(Còn tiếp)

Chủ Nhật, 16 tháng 8, 2015

Cí cây

Cũng đã lâu rồi anh lại phải làm thơ
Về tình yêu, về những điều vô nghĩa
Về cái dốc cuộc đời đã gần qua một phía
Và về những cái cây...
Tình yêu là một cái cây
Non nớt lắm và mong manh đến lạ
Một cái cây không bao giờ có lá
Để anh có thể ẩn mình trong những lúc bão dông
Nói chi lắm những điều viển vông
Bởi người ta vẫn thường hay như thế
Ví tình yêu với những điều như thể
Sống trên đời là để chết vì một cái cây
Không! Em ơi
Bởi tình yêu là một cái cây
Không chăm bón một giây thôi là sẽ chết
Khi những dư âm chưa bao giờ tan hết
Ai cũng chỉ nhận về mình vai của kẻ nạn nhân
Ai rồi cũng qua những giây phút phân vân
Không biết có nên gieo lên một mầm cây mới
Có nên chắn che thêm một mầm cây bởi
Anh đã sống gần nửa cuộc đời với những cái cây...

Hà Nội, hư vô 210515

Thứ Bảy, 31 tháng 1, 2015

Apache Solr hơn cả tuyệt vời để bắt đầu "Full-Text Search"

Trong quá trình phát triển web, với các website đòi hỏi cao về khả năng tìm kiếm, developer thường đối mặt với nhiều vấn đề nếu dùng mysql để thực hiện chức năng này. Ví dụ: tìm kiếm và ranking kết quả với nhiều tiêu chí cùng một lúc, hoặc xây dựng bộ lọc cho tìm kiếm, hay xây dựng một bộ từ điển dùng để autocomplete và sugestion. Khi đó nếu sử dụng mysql thì vấn đề gặp phải sẽ là rất khó để xây dựng quan hệ giữa các bảng, các trường, đồng thời số lượng truy vấn vào mysql là rất nhiều, và phải thực hiện đánh chỉ mục khá đồ sộ. Việc này là thực sự không cần thiết và đôi khi là bất khả thi với những hệ thống được xây dựng trên những máy chủ có sức mạnh không cao. Để nhằm khắc phục những vấn đề gặp phải đó, rất nhiều flatform search engine ra đời, phải kể đến như là sphinx, solr, elasticsearch ... Trong khuôn khổ những bài viết liên quan này, hungls không bàn đến ưu, nhược điểm hay so sánh giữa các flatform mà sẽ đi sâu vào giới thiệu cũng như hướng dẫn để cấu hình một search-engine được đánh giá là rất mạnh hiện nay, đó là Apache Solr.

Tho khong dau (Thơ không dấu nha)

(Mất ngủ, hồn đi lung tung, lạc cả vào bãi tha ma, hết cả hồn)

Hoang mang lang thang cho vui
Ai xui ngang qua tha ma
Nghe xa ai ca vang vang
Xung quanh ta hoa xinh xinh...

04-11-13

Tự khúc

(Sinh nhật không ai tặng quà,
Thôi đành làm một bài thơ tặng mình.)


Thì ta thức trắng đêm này
Để ta sống trọn một ngày nên vui
Và thì cay đắng ngọt bùi
Nếm sao là đủ ngậm ngùi xuân xanh
Hai sáu năm một bức tranh
Tô tô vẽ vẽ để thành nét riêng
Mẹ ngồi đưa cái võng nghiêng...


23-01-13

Nhạt (Tự hoạ)

(Hồi đó chưa yêu, giờ yêu rồi thấy cũng khác :D)

Không bia không rượu không cờ
Không bài không bạc không lờ... ô lô
Không khôn cũng chẳng ngây ngô
Không yêu cũng chẳng màu tô cuộc đời

19-04-13